Ivan Begtin
8.03K subscribers
1.75K photos
3 videos
101 files
4.45K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Forwarded from Ivan Begtin (Ivan Begtin) via @vote
Должно ли государство зарабатывать на предоставлении данных в государственных информационных системах?
anonymous poll

Нет, не должно. Государство создает всё на деньги налогоплательщиков, всё должно предоставляться без взимания платы, в виде откр – 142
👍👍👍👍👍👍👍 87%

Нет, не должно, но может вводить частно-государственные партнерства когда зарабатывать могут частные компании, тарифы которые ре – 17
👍 10%

Да, должно. Это единственный способ отбивать инвестиции в создание электронной инфраструктуры – 5
▫️ 3%

👥 164 people voted so far.
Обновлённый сайт официальной статистики Шотландии [1] теперь полностью data-ориентированный.
Основной акцент сделан на доступности наборов данных, возможности выгрузить их в CSV и форматах связанных данных (N-Triples), а также на работе с данными через API. Много руководств и разъяснений о том как пользоваться API, выгружать наборы данных и многое другое.

Всё это на программном продукте Swirrl [2] в котором изначально заложен механизм работы со связанными данными.

Пример применения этого движка можно увидеть и на сайте муниципальной статистики Великобритании [3]

Я лично считаю что в основе любой статистической системы сейчас должен быть принцип data-first (вначале данные). Всё остальное: визуализация, интерпретация и анализ - должны быть основаны на опубликованной методологии, не более того.

Ссылки:
[1] https://statistics.gov.scot/home
[2] http://www.swirrl.com/
[3] http://opendatacommunities.org

#opendata #linkeddata
То чем в России занимается Роскомнадзор, во Франции, пока бессистемно, но уверенно французский суд потребовал от интернет-провайдеров заблокировать доступ к 57 доменам библиотеки LibGen и Sci-hub. Об этом пишет Компьютерра [1] и можно прочитать само решение суда [2].

Это славное начало во Франции может закончится столь же плачевно как в России, появлением реестра блокируемых доменов и органа власти который будет его вести. В принципе в Европе и не только цензура копирайта очень сильна и то что она начинает обрастать заведомо бессмысленными формами - это особенно показательно. Рынок VPN на подъёме, много бесплатных сервисов, социальные сети, каналы в телеграм и другие способы распространения. Цензура плохо работает в связанном, но децентрализовванном мире, ещё сложнее её внедрить в странах с полноценной демократией.

Ссылки:
[1] https://www.computerra.ru/236325/frantsuzskim-provajderam-prikazali-zablokirovat-sci-hub-i-libgen/
[2] https://torrentfreak.com/images/scihuborder.pdf

#privacy
Официальная информационная политика государства по "цифре" - это отражение самой госполитики. Мне никогда не нравилось как отражались госпрограммы/госпроекты, что публиковали и публикуют о них органы власти и нынешний официальный сайт программы "Цифровая экономика" digital.ac.gov.ru ничем не лучше.

Но давайте вместо того чтобы рассказывать чем и в чём он плох, я расскажу в том как подобные инициативы отражаются в других странах.

Новая Зеландия www.digital.govt.nz

Акцент на стандарты, продукты, примеры проектов, детально описанные кейсы внедрения цифровых технологий и общую стратегию. Обратная связь через блог. Основная аудитория - госслужащие вовлеченные в проект, внешние эксперты изучающие опыт, граждане интересующиеся пользой от цифровизацией и результатами.

США digital.gov
Формирование сообщества, результаты проектов (примеры), события, обучение цифровизации и тд. Основная аудитория - госслужащие и их погружение в процесс через сообщества практики.

Канада canada.ca (раздел на сайте пр-ва) [1]
Общая стратегия, стандарты, госполитика, технологии, возхможности трудоустройства, онлайн образование, открытые данные.

Подводя итоги. Чего нет на сайтах цифровых стратегий и цифровых государств в мире:
1. Бессмысленных не относящихся непосредственно к деятельности государств новостей
2. Того что сколько куда и на что выделено денег. Как ни странно, на деньгах акценты бывают только в России, в остальных странах на результатах.

Что там обязательно есть практически всегда:
1. Максимально про открытые данные и общую политику открытости.
2. Формирование сообществ из госслужащих вовлечённых в процесс
3. Стандарты, обязательно стандарты публикации и обмена данными. Стандарты цифровых закупок, стандарты дизайна сайтов, стандарты документирования и многое другое.

Ссылки:
[1] https://www.canada.ca/en/government/system/digital-government.html

#digital #opendata #data
Пока в России заключённых пытаются лишить йоги, в других странах активно идут эксперименты по социализации выходящих из тюрем и снижению рецидивизма. Один из таких примеров - это Code 4000 [1]. британская НКО обучающая заключённых программированию. Их программа смоделирована по аналогии с программой Last Mile ранее проводившейся в тюрьме Сент Квентин, Калифорния, США.

В Великобритании вся эта инициатива финансируется из специального фонда цифровых навыков (Digital Skills Fund) помогающего вовлекать уязвимые группы граждан в цифровую среду [3]

Ссылки:
[1] https://www.code4000.org/en
[2] https://thelastmile.org/
[3] https://www.gov.uk/government/news/coding-to-be-taught-in-prison-to-help-offenders-return-to-the-world-of-work

#digital #coding
Международные инициативы по цифровизации государства в большинстве своём, появились из инициатив по открытости, в первую очередь, открытости данных.

Этих инициатив довольно много:
- Open Government Partnership [1]
- Open Data Charter [2]
- Digital 9 [3]

А также повестка по цифровизации есть в ОЭСР, отдельных направлениях работы ООН вроде проекта GODAN по открытости данных в сельском хозяйстве.

Так вот, Россия не участвует ни в одном из них, в ОЭСР не входит и в ООНовских проектах не участвует. Если при Открытом правительстве была на самом старте попытка вступить в OGP, то далее не было ни одной.

В итоге у нас сейчас цифровая самоизоляция. При том что самые интересные компетенции копятся сейчас именно в Digital 9 - это Канада, Эстония, Израиль, Мексика, Новая Зеландия, Великобритания, Португалия, Республика Корея и Уругвай. Которое возникло из, вначале, Digital 5, а далее Digital 7 и вот теперь уже 9 стран обменивающихся практиками создания цифровых государственных проектов.

Напомню что во всем что подразумевается под цифрой в мире - цифровые проекты основаны на открытости. Это всегда переход от Open government к Digital Government.

Ссылки:
[1] https://www.opengovpartnership.org/
[2] https://opendatacharter.net/
[3] https://en.wikipedia.org/wiki/Digital_9

#digital
Forwarded from Эшер II
👉 05 апреля 2019 года суд после трех заседаний оштрафовал компанию Twitter за отказ хранить персональные данные пользователей в России. На 3000 рублей. Забавной особенностью процесса был тот факт, что Twitter присылал представителей в суд:
https://zona.media/online/2019/04/05/twitter-sud3

⚡️ 08 апреля 2019 года. Интересную и очень неприятную историю публикуют коллеги из канала «Утечки информации»: https://publielectoral.lat/dataleak/916
В открытом доступе обнаружена незащищенная база данных, в которой хранятся данные московских станций скорой медицинской помощи (ССМП). В базе содержится:
дата/время вызова
ФИО членов бригады скорой помощи (включая водителя)
госномер автомобиля бригады скорой помощи
статус автомобиля бригады скорой помощи (например, “прибытие на вызов”)
адрес вызова
ФИО, дата рождения, пол пациента
описание состояния пациента (например, “температура >39, плохо снижается, взрослый”)
ФИО вызывавшего скорую помощь
контактный телефон
и многое другое…

👆 База была украдена и выложена в публичный доступ и гуляет там уже несколько дней. Авторитетные источники говорят, что база похожа на настоящую и еще вчера имела актуальные свежие данные.

✌️ «А ведь владельцы этой базы данных - наверняка со всех сторон прикрыты бумажками считаются добросовестным оператором персональных данных. И даже больше - по этим бумажкам они всё сделали абсолютно правильно. Только вот данные почему-то в открытом доступе и, судя по всему, останутся там уже навсегда», — резонно замечает канал «Ватфор»: https://publielectoral.lat/vatfor/4201
Плохие новости и не стоит думать что этот не затронет буквально всех
Forwarded from Roem.ru
Законопроект о «Суверенном Рунете» прошёл 2-е чтение.
320 депутатов «За», 15 — «Против», «Воздержавшихся» нет

3-е финальное чтение — 16 апреля. В нём текст уже не меняют. Большой разбор текста 2-го чтения:
https://roem.ru/11-04-2019/276997/suverenniy-runet-2-chtenie/
Вчера на круглом столе по будущему российской статистики в рамках XX апрельской конференции НИУ ВШЭ было обсуждение будущего Росстата.

Я кратко сформулирую мои тезисы, озвученные там:
1. Основными потребителями официальной статистической информации являются граждане, все экономические акторы принимающие решения. Росстат не должен ориентироваться исключительно на потребителей в органах власти.
2. Доверие к официальной статистике может и должно формироваться не только через обеспечение понятности используемых методик расчета показателей, но и через раскрытие исходного кода используемого для расчета этих показателей.
3. Важным аспектом официальной статистики является отсутствие гипер локальных, муниципальных данных. Раскрытие этих данных сейчас недостаточно удобно, недостаточно полно, недостаточно проверяемо.
4. Критичен вопрос огромного объема ведомственной статистики, не подпадающей под публичное раскрытие и не предоставляемых органами власти в Росстат. Как минимум это касается таких ФОИВов как Минздрав, МВД, Миннауки и многих других. Росстат сейчас не выступает единым методологом.

Конечно же ключевой вопрос в этом всём - это кризис доверия к данным официальной статистики и интенсивный поиск альтернативных источников актуальных и оперативных данных, как потребителей данных внутри государства, так и частным сектором. Этот кризис доверия уже не первый год формирует вопрос внутри государства и вне его о необходимости существования официальной статистики в той организационно-технической форме в которой она существует сейчас.

#data #stats #openness
На форуме Big Data 2019 состоялась дискуссия «Нерешенный вопрос: право на данные». Представители государства и бизнеса обсудили проблемы использования данных в госуправлении, медицине и других областях. Эксперты постарались ответить на вопрос, как нужно изменить правовое регулирование, чтобы развивать рынок данных в России.

- Что такое рынок данных и как его можно измерить?
- Что значит «государство как платформа» и зачем гражданину «цифровой профиль»?
- Кому принадлежат данные пациентов?
- Как право регулирует применение искусственного интеллекта и кто такие техно-оптимисты?

Подробнее: http://aurd.ru/big_data_forum_2019.
И кстати, мы расширяем команду по направлению открытости Гос финансов, если интересно или есть кого порекомендовать - пишите на op@clearspending.ru
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Мы рады сообщить, что в этом году перед нами стоят амбициозные задачи по работе с открытыми финансовыми данными, поэтому мы значительно расширяем команду проекта ГосЗатраты (и команду Информационной культуры)!

Мы ищем тех, кто дружит с Python Django, MongoDB, PostgreSQL, любит открытые данные, не боится данных о госфинансах и готов работать в офисе в центре Москвы. Нам нужны:
- фронтенд разработчики,
- бэкенд разработчики,
- тестировщики,
- специалист по документации.

Также нам нужны специалисты по госфинансам, с которыми мы будем консультироваться по профильным вопросам.

Формальное и уточненное описание вакансий мы чуть позже опубликуем, а пока хотим поискать среди друзей друзей. Пишите в ЛС или на op @ clearspending.ru :).
Forwarded from data.csv
В командах хакатона +1: теперь можно присоединиться к «Информационной культуре» и поработать над темой: «Меньшинство решает за большинство: люди, которые предлагают законы — кто они».

Ментор команды Иван Бегтин.

Почему эта тема интересна?

Среди депутатов Госдумы, есть те, кто внёс сотни законопроектов и те, кто не внес ни одного. Кто именно был активен? Какие законы максимально отразились на нашей жизни? Как определить вероятность принятия законопроекта от конкретного депутата?

Ответы на эти вопросы помогут приблизиться к понимаю того, как на самом деле устроено законотворчество в России, и выявить факторы, влияющие на «успешность» законопроекта».

Присоединяйтесь к команде ➡️
https://docs.google.com/forms/d/e/1FAIpQLSe0D10jLXbJXPf1SQPRfMNiSL1oB8IMJNA48dz-TiPepCZ2_A/viewform
Интересная новость. Про какие полномочия речь, кто знает?
Forwarded from Нецифровая экономика (Elizabeth Sergina)
Так-так, запахло жареным. Носков хочет отобрать у Жарова часть полномочий. Если сможет.

«Механизм регуляторной гильотины, который был не так давно объявлен, предусматривает масштабный анализ и пересмотр действующих функций контрольно-надзорной деятельности. Сфера деятельности Роскомнадзора сегодня чрезвычайно широка. Нужно проанализировать, от каких полномочий можно и нужно отказаться»,— сказал господин Носков. https://www.kommersant.ru/doc/3945804
Всегда сложно писать про очевидное, но иногда необходимо. Я таки написал текст про то что практически в каждом проверенном органом власти используется пиратский MS Office, где-то больше, а где-то меньше, но всё это выявляется по косвенным признакам. Подробно об этом у меня блоге https://begtin.tech/government-piracy/, а данные можно скачать и исследовать самостоятельно на data.world https://data.world/infoculture/government-piracy

Вопросов может оказаться много, задавайте - я отвечу. Для меня это давняя тема которую я всё откладывал и откладывал года 3, но дозрел до того чтобы оформить хотя бы таким кратким образом.

#data #piracy #opendata #research
В августе-сентябре 2018 года я готовил непубличное исследование по неочевидным источникам утечки персональных данных граждан из государственных информационных систем или же частных систем регулируемых государством специальными законами.

Это то что я делал лично, даже не пересекаясь с нашими проектами Инфокультуры и Ассоциации участников рынка данных, потому что пока не понятно как тему утечек перс данных погрузить в их работу.

Исследование получилось большое, серьёзное, целиком его публиковать нельзя совершенно точно. Я направлял его официально в Роскомнадзор и неофициально в Минцифру. Роскомнадзор отреагировал в стиле "кое в чём Вы правы, кое в чем нет, так что давайте обсуждать", от Минцифры открытой обратной связи вообще не было.

Через некоторое время обнаружилось что часть исследованных систем были исправлены, но меньшая часть. Самим владельцам систем сознательно ничего не рассылалось, только регуляторам

Прошло более полугода и я лично считаю что все моральные обязательства "не бить публичностью" были соблюдены и уже можно говорить об этом в открытую.
При этом часть результатов нельзя публиковать в виду их чувствительности и сейчас. Но та часть которая касается тех перс данных которые публикуются из-за специфики их интерпретации субъектами регулирования, вполне достойна публикации.

Итак вопрос и опрос.
Публиковать ли подробно справку о том из каких систем публикуются сведения о физ. лицах, почему и в каком объеме или не делать чтобы не нанести большего вреда, и передать всё спецслужбам?
public poll

опубликовать всё что возможно – 169
👍👍👍👍👍👍👍 91%

не публиковать, передать правоохране – 16
👍 9%

👥 185 people voted so far.