Меня периодически спрашивают как можно помочь открытости данных и куда приложить свои силы.
Что делать тем кто хочет помогать человечеству с открытыми данными и не знает как?
Ответы на этот вопрос есть и их много. Я опишу самые очевидные и нужные шаги.
1. Преобразование существующих данных в HTML/PDF/DOC в открытые данные.
Более 500 массивов данных у нас в хабе открытых данных доступны в формате HTML и только — http://hub.opengovdata.ru/dataset?res_format=HTML однако эти данные каталогизированы неслучайно. Каждый из Вас может взять любой из перечисленных там массивов, написать парсер для данных, и преобразовать данные в XML, CSV или другой удобный и полезный формат.
2. Сделать массив данных в RDF
Много данных у нас в России публикуется вот уже прямо сейчас в CSV и XML, однако данных в RDF почти совсем нет. Я знаю всего два таких массива данных — Каталог станций ВМО http://hub.opengovdata.ru/dataset/katajior-ctahunn-bmo и онтология административного деления в OWL — http://hub.opengovdata.ru/dataset/adm-ontology
Пространство пусто и востребовано! Нужно больше данных в RDF/OWL, переход к Linked Data и интеграция в облако открытых связанных данных.
3. Преобразование данных в удобные форматы
Вот простая задачка. Администрация города Краснодара опубликовала кучу данных по городским объектам — http://krd.ru/opendata/# однако данные все в CSV и XML форматах. Однако для удобства данные куда удобнее в гугловском KML формате или в Яндексовском YMapsML. Преобразование данных — это маленькая и несложная задачка — и полезная тоже.
4. Загрузка данных в хаб открытых данных
Мы постепенно стараемся все каталоги открытых данных затянуть в хаб — hub.opengovdata.ru, это не очень сложно, но охватили мы пока, понятное дело, не все.
Например, с московского портала данные извлекаются — https://github.com/infoculture/mosopendata
Вы можете нам тут существенно помочь. Сделав парсеры для:
— Краснодарского портала — http://krd.ru/opendata/
— Зеленоградского портала — http://data.zelao.ru
и всех остальных порталов перечисленных тут — http://hub.opengovdata.ru/group/catalogs