Каждый знает, как трудно порой не только найти, но и прочитать рукописный текст архивного документа. Команда «Яндекса» в помощь исследователям запустила новый сервис «Поиск по архивам» https://yandex.ru/archive , который, как предполагается, позволит быстро находить имена, фамилии, названия населенных пунктов и любые другие слова в рукописных документах XVIII — начала XX века. Сейчас в базе более 2,5 миллионов архивных документов из хранилищ Москвы, Оренбурга и Великого Новгорода. Со временем количество фондов и источников будет увеличиваться.
На этапе запуска эксперты отобрали самые востребованные материалы: метрические книги с записями актов гражданского состояния (рождений, браков, смертей), исповедные ведомости со списками прихожан церквей и ревизские сказки с результатами переписей населения. Для удобства поиска есть фильтры по годам, фондам, описям и названиям документов.
Сервис работает на базе технологии оптического распознавания текста Яндекса. Нейросети узнают утратившие актуальность символы, учитывают особенности почерка и за несколько секунд превращают непонятные неподготовленному человеку записи в печатный текст.
Рекомендации по поиску
1. Если вы знаете фамилию человека и место его рождения или проживания, лучше начать поиск именно с этого. Например: Некрасов деревня Ступино
2. Если вы ищете конкретного человека и знаете его имя и фамилию, помогут специальные символы.
- Запрос в кавычках покажет документы со словами в строго заданной последовательности: "Александр Иванович Попов"
- Знак * соответствует одному пропущенному слову. Например, если вы не знаете отчество, то искать можно вот так: "Александр * Пушкин"
- Все подробности о языке запросов собраны https://yandex.ru/support/search/query-language/search-context.html
3. Не забывайте про фильтры: можно выбрать нужный год или конкретный архив, если вы знаете, что документ хранится именно в нём.
4. Учитывайте, что раньше отчества часто заканчивались на «-ов». Например, Иван Максимович Иванов в документах XVIII века может быть указан как Иван Максимов Иванов.
5. Если вы не нашли упоминаний о человеке, возможно, документы о нем еще не оцифрованы архивным фондом или не расшифрованы сервисом. Попробуйте поискать еще раз позже.
Источник: https://yandex.ru/archive/about#how-to-search
О том, как Яндекс учился распознавать, что написано в рукописных архивах: https://habr.com/ru/company/yandex/blog/712510/