Учёные заканчивают распознавание миллионов венецианских документов
Учёные завершают грандиозный проект по оцифровке архивов Венецианской республики за весь период её существования. И речь идёт не о простом сканировании документов. С помощью машинного обучения учёные ведут поиск и находят биографические и иные взаимосвязи внутри информации. О проекте Venice Time Machine (Венецианская машина времени) сообщает Nature.
Старт проекту был дан в 2012 году. Уже обработаны сотни тысяч документов: рапорты полиции, письма послов, счета и расписки. До многих из этих бумаг историки ещё не доходили. Компьютерные алгоритмы значительно упростят исследовательскую работу. Исследованы не только документы и книги, но и картины. В ближайшие годы сканеры проекта будут усилены технологией компьютерной томографии, благодаря которой содержимое ветхой книги можно будет распознать, не раскрывая ее. Пока исследователи из Федеральной политехнической школы Лозанны работают с химическим составом средневековых чернил, пытаясь определить нужные молекулы, способные стать рентгеноконтрастными веществами.
В случае успеха «Машины времени» планируется запустить в других европейских городах, с большими архивами. Первый кандидат — Амстердам, величайший торговый центр Запада раннего Нового времени (XV-XVIII вв.). Сопоставление венецианских и амстердамских архивов только по именам купцов даст в руки историков мощный инструмент реконструкции экономической истории Европы.