Посты за: Сентябрь, 2008

Quarkbase: сайт о сайтах

Наткнулся на ещё один сборщик информации о веб сайтах — http://www.quarkbase.com/ , в отличии от AboutUs.org и BuiltWith он собирает информацию ещё и по ряду социальных и онлайновых сервисов.

Инструменты любопытные, но, признаться, я сомневаюсь в их коммерческой ценности. Несмотря на то что у меня есть несколько алгоритмов довольно

Читать больше

Техническое: Алгоритмические подходы

Чем дальше тем больше я убеждаюсь что все существующие подходы к оптимизации алгоритмов и повышению производительности и точности алгоритмов можно свести к 3 разным подходам.

1. Технологический

Подход по оптимизации «в лоб». Переписать алгоритм на ассемблер, взять другой компилятор, запустить расчёты в сети распределённой сети, задействовать более быстрые процессоры, диски и память,

Читать больше

German government tells citizens not to use Google Chrome

Подробнее в публикации на Blogospcoped и видео с новостью (на немецком) про Chrome, видео начинается с 7:09.

Одновременно хочеться отметить что в России ведомства аналогичного Германскому не существует и по сей день. До сих пор ни Минсвязи, ни силовые ведомства никак не регулировали и не публиковали рекомендаций по информационной

Читать больше

Заметка в Юзабилити бюллетене

В Юзабилити бюллетене (UPA Russia) опубликовали мою заметку Целостность формы представления информации, интересующимся также могу посоветовать почитать остальные статьи из бюллетеня, там немало интересных материалов.

Читать больше

Техническое: CouchDB и его применимость

В эти выходные мне сравнительно немного удалось поработать за компьютером, была уйма других дел, а вот краулеры и нагрузочные тесты на CouchDb как раз смогли отработать полностью.

За пару дней на мой небольшой домашний сервер удалось собрать информацию по доменам в зоне SU, корневые страницы, данные whois и так далее и

Читать больше

Техническое: Про исправление опечаток продолжение

Вдогонку к предыдущему тексту, исправляю упущение отсутствия цифр.

Так вот задачка с использованием расстояния Левенштейна решается очень быстро фильтрами и созданием специальных индексов объём которых может достигать и превосходить объём выборки слов.

Например мои короткие тесты на базе в 100 000 русских слов из словаря Зализняка и расстояния Левенштейна равное 2 показали

Читать больше

Мир как поток и совокупность информации 5. Информационная психология

Психология жизни в информационной среде и восприятия информации отдельным человеком — это, пожалуй, одна из наиболее сложных для меня тем. Причём сложность её даже не столько в отсутствии понимания, сколько в абстрагировании от уже имеющихся подходов психологических — по анализу раздражителей и физиологических — по органам восприятия чувств.

Итак, информационная психология.

Читать больше

Неприятности

Стоит начать размышлять о промышленной эксплуатации продуктов как то CouchDb, возможностей по управляемости и восстановлению при сбоях — как сбои случаются.

На домашнем сервере у меня посыпался один из дисков, причём основательно — не читается суперблок в ext3fs, похоже что появились и система не грузится и файловая система не распознаётся.

К счастью,

Читать больше

Вопросы

Может кто сможет помочь с ответами на пару вопросов.

1. Кто знает кто делал новый сайт МинСвязи ?

Мне, как всегда, там нехватает RSS. Правда, что приятно, Скиур изменения на сайте подхватил и RSS мне всё же сформировал.

2. Какие наиболее популярные RSS читалки в Рунете помимо Ленты Яндекса и ридера Гугла?

Читать больше

Эффективное геокодирование данных

Продолжая тему геокодирования или геотеггинга веб сайтов и любых объектов в принципе опишу чуть подробнее даже не сами алгоритмы, а принципиальный подход к подобной классификации — поскольку геокодирование это именно классификация и, более того, это можно сравнить с назначением тэгов. Подход описываемый мною далее, в общем случае, применим к любому

Читать больше

Яндекс.Метрика