Посты за: Июль, 2008

Цифровые подписи. Вопрос

Кто-нибудь знает как можно проверить цифровую подпись и подписать документ в Firefox/Windows и Firefox/Linux ?

С авторизацией по сертификатам всё понятно. Интересует именно работа с подписями документов, по аналогии того как в IE вызывается ActiveX объект для этой цели.

Читать больше

ODF в НАТО и в EIF

По сети бродит ссылка НАТО (NATO) выбрали ODF как один из форматов передачи документов. Причём похоже упоминается что возможное влияние на решение оказал голландский министр обороны, поскольку в голландии Open Source особенно распространён.

Интереснее будет ситуация если ODF включат и в EIF (European Interoperability Framework) учитывая особую любовь

Читать больше

Google Begun

Reuters cообщает о том что зарегистрированная в Великобритании компания Рамблер.Медиа продала сервис  контекстной рекламы «Бегун» (ЗАО «Бегун») компании Google.

Про то как это хорошо для Гугла написали и пишут уже немало. Пусть Бегун и не самый удобный сервис, но клиентская база у него несомненно есть. Куда интереснее вопрос о том

Читать больше

Госзакупки: Счетная палата провела анализ закупок для государственных нужд

Интересные новости.

4 июля 2008 года Коллегия Счетной палаты Российской Федерации под председательством Сергея Степашина утвердила аналитическую записку «Комплексный анализ эффективности функционирования существующей системы закупок для государственных нужд». С сообщением выступил аудитор Александр Пискунов.

Проведенный анализ показал, что действующая система заказов функционирует неэффективно вследствие несбалансированного развития составляющих её элементов. До

Читать больше

Регулярные выражения на больших выборках данных

Обнаружил интересное исследование A Fast Regular Expression Indexing Engine и подход к применению регулярных выражений на больших датасетах в вебе на основе предварительного индексирования NGram.

Учитывая что я сейчас активно размышляю (активное размышление=проведение экспериментов) над схожей темой, мне вспомнилось как ещё пару лет назад у меня выдался разговор с разработчиком

Читать больше

Ссылочный спам. Подходы к решению проблемы

Я давно не затрагивал тему ссылочного спама, собственно мои исследования уже с месяц как закончились и за рутинными делами и другими исследованиями было немного времени уделить теме больше внимания.

Как я и упоминал ранее, борьба со ссылочным спамом — это скорее рутинная чем сложная задача.

Помня своё обещание рассказать о том как

Читать больше

Техническое. Google Protocol Buffers

Google на днях открыли спецификацию и код Protocol Buffers (http://code.google.com/p/protobuf/), IDL для описания структур данных и обмена ими.

Что-то в их подходе безусловно есть, читать такие спецификации проще чем XML и уж тем более RDF, но и ограничения тоже должны присутствовать.

Что важнее — их подход из мира высоких нагрузок и

Читать больше

Извлечение структурированных данных — чтение

Месяца два назад мне попалась на глаза диссертация Эрика Шляйтера (Erik Schlyter) «Structured Data Extraction«, она есть в сети по ссылке и довольно любопытна. Автор делает обзор нескольких алгоритмов по извлечению данных из HTML и применимости такого подхода для извлечения данных о продуктах в своей системе PIEME.

Из материалов по

Читать больше

Построить Second Life на базе Open Source

Теперь возможно с помощью OpenSimulator — проекта на Mono под BSD лицензией позволяющего запустить свой собственный OpenSim сервер.

В свою очередь Linden Labs и IBM уже анонсировали возможность переноса аватара из одного мира в другой. Стоит также упомянуть Open Grid Protocol , спецификацию по переносимости виртуальных объектов которая

Читать больше

Ссылки на 12.07.2008: Веб, обработка и извлечение информации

  • Harvard University. Time Series Center — банки данных, исследования и публикации по временным рядам. В основном применительно к научным дисциплинам, но и затрагивая computer science тоже.
  • OpenVisuals — движок для визуализации с открытым исходным кодом.
  • Datasets — большая подборка наборов данных (англоязычных)
  • Airline Data Project — статистическая информация по

    Читать больше

Яндекс.Метрика