
Image by Bernard Goldbach, from Flickr
Цифрові архівісти працюють, щоб врятувати публічні дані від зникнення
Протягом понад 30 років, Wayback Machine Інтернет-Архіву зберігає урядові веб-сайти та набори даних, що є критично важливими для досліджень, як це детально описано в новому звіті від Spectrum.
В поспіху? Ось основні факти:
- Машина часу зберігає важливі урядові дані, які служать життєво важливим матеріалом для наукових та інженерних досліджень.
- Під час другого президентського терміну Трампа більше ніж 8,000 урядових веб-сторінок та баз даних зникло з публічного доступу.
- Лабораторія інновацій бібліотеки Гарвардського університету успішно зберегла 311,000 наборів даних, які були частиною колекції Data.gov.
Ці записи, отримані від таких організацій, як NASA та Національний науковий фонд, надають незамінні дані для науковців і інженерів. Якщо вони зникнуть, достовірність досліджень та історична правдивість опиняються під загрозою, як було зазначено в Spectrum.
Видалення даних урядом – це не новий феномен. Після 11 вересня, адміністрація Буша видала мільйони байтів інформації з міркувань безпеки. Адміністрація Обами обрала інший підхід, запустивши Data.gov у 2009 році для розширення публічного доступу, як повідомляє Spectrum.
Протягом першого терміну Трампа, дослідники з Ініціативи управління та захисту даних про навколишнє середовище виявили, що деякі урядові веб-сайти стали недоступними, а посилання на “зміну клімату” були видалені з багатьох сторінок, каже Spectrum.
Під час другого терміну Трампа, стурбованість збереженням даних зросла. У лютому The New York Times повідомив, що було видалено більше ніж 8 000 веб-сторінок та баз даних уряду.
Деякі з них згодом з’явилися знову, але Grist виявила зміни, включаючи видалення таких термінів, як “зміна клімату” та “чиста енергія”. 11 лютого настали юридичні виклики, федеральний суддя наказав відновити певні набори даних Центру контролю та профілактики хвороб (CDC) та Управління з контролю за продуктами та лікарськими засобами (FDA), як повідомило Spectrum.
Для боротьби з цією втратою, цифрові архіваріуси вжили заходів. Лабораторія інновацій бібліотеки Юридичного факультету Гарварда скопіювала весь 16-терабайтний архів Data.gov, який містить понад 311 000 наборів даних. Вони використовують автоматизовані запити через API, щоб щодня оновлювати його.
Архіваріуси відіграють життєво важливу роль у збереженні знань, підтримуючи історичні записи для майбутніх поколінь. Втрата важливої інформації через їх відсутність призведе до переписування публічних записів, що обмежить можливості майбутніх досліджень.
Лишити коментар
Скасувати