Разделы

Цифровизация Внедрения ИТ в госсекторе

Завершен очередной этап проекта по внедрению технологий PROMT в ФИПС

Завершился очередной этап проекта по внедрению технологий компании PROMT в Федеральном институте промышленной собственности (ФИПС). Новая версия PROMT Translation Server, специально разработанная для ФИПС, включает в себя дополнительные возможности: модуль электронного словаря на основе специализированной словарной базы PROMT и словарей ФИПС, модуль распознавания графических файлов, модифицированную систему аутентификации и целый ряд настроек, позволяющих сделать манипуляции с платформой перевода еще более удобными. Нововведения позволили ФИПС оптимизировать работу патентных экспертов при работе с разноязычной информацией, сообщили CNews в компании PROMT.

ФИПС принимает и обрабатывает более 50 тыс. патентных заявок в год, в том числе и международных, которые необходимо проверить на схожесть с уже существующими в других странах, чтобы зарегистрировать инновацию или изобретение. Эксперты института ведут поиск по более чем 110 млн документов в мировых базах, и ежедневно каждый специалист должен просматривать большой объем информации на европейских языках, чтобы вынести экспертное заключение. Поэтому система, которая способна выполнить качественный автоматический перевод с нескольких языков, оптимизирует работу всего ведомства и напрямую влияет на скорость рассмотрения заявок, подчеркнули в компании.

Основной задачей, стоявшей перед PROMT в рамках проекта, было создание многофункциональной масштабируемой платформы перевода для автоматизации процесса перевода текстов и документов графических форматов и запросов в поисковые международные системы. На сегодняшний день платформа обеспечивает мгновенный перевод патентного документа или его фрагмента с английского, немецкого, французского, итальянского и испанского языков на русский язык. В новой версии к переводу текстовых файлов добавлена возможность перевода графических файлов (JPG, PDF), которые часто встречаются в работе экспертов ФИПС. Также программа автоматически переводит с русского языка запрос по ключевым словам от эксперта к поисковой системе PatSearch для возможности поиска релевантной информации в базах патентов на различных языках. В среднем за день, по данным PROMT, на платформу поступает 800 запросов на перевод, что составляет почти 2500 страниц текста или 625 тыс. слов.

Главной особенностью системы является ее возможность обучаться на новых данных, предоставленных экспертами ФИПС. Терминологические базы данных, которые могут создавать и пополнять эксперты, работающие в системе, позволяют повысить качество перевода патентной информации. Кроме того, эксперты имеют возможность обмениваться базами между собой.

Для обеспечения требуемого качества перевода была внедрена интеллектуальная гибридная технология автоматического перевода, которая делает автоматический перевод более «гладким» и стилистически корректным, но при этом учитывающим специфическую лексику экспертов ведомства. Эта технология является синтезом традиционного перевода на основе грамматического описания естественного языка (RBMT) и автоматического редактирования полученного автоматического перевода с помощью анализа статистических моделей. Модули для статистического постредактирования были построены на базе профессиональных русско-английских переводов, предоставленных ФИПС, пояснили в PROMT.

«ФИПС был одной из организаций, которая осознала эффективность развертывания централизованного решения и для нужд конечного пользователя и для встраивания в другие информационные системы организации. Благодаря тому, что ФИПС предоставил большие массивы параллельных данных (оригинальных патентов и их переводов), удалось применить технологию гибридного перевода, доказав ее эффективность для быстрой настройки “под пользователя” и получения качественного перевода в тех случаях, когда у организации накопилось много документов и их переводов. Такой комплексный подход позволяет, по нашему мнению, извлечь максимальную пользу от применения технологий автоматического перевода», — заявил Александр Серебряков, руководитель отдела корпоративных решений PROMT.

В тренде мультиоблако — изучаем плюсы и минусы
Облака

Платформа перевода используется не только экспертами ФИПС, но и пользователями международного пилотного проекта по программе Patent Prosecution Highway. Эта программа предназначена для того, чтобы зарубежные ведомства в рамках проекта могли работать с российскими полностью англоязычными документами.

«Практика нашего многолетнего сотрудничества с компанией PROMT подтвердила правильность нашего первоначального решения о выборе партнера для решения задач машинного перевода текстов патентных документов. Благодаря высокому качеству перевода PROMT мы даже сейчас, когда широко доступны бесплатные средства машинного перевода, не ставим вопрос об отказе от услуг наших партнеров, — подчеркнул Денис Виноградов, ВРИО директора ФИПС. — Компания всегда оперативно откликалась на наши пожелания, иногда специфические для технологии работы в ФИПС. Это касалось и создания гибридной системы перевода патентных документов, и специальной функциональности по переводу запросов на поиск в англоязычных базах данных, и автоматического подключения словарей с учетом тематики документов. Более 600 экспертов ФИПС активно используют машинный перевод от компании PROMT в своей ежедневной работе».

Как отметили в PROMT, компания сотрудничает со структурным подразделением федеральной службы по интеллектуальной собственности уже более 15 лет. В качестве базы для платформы перевода ФИПС был взят флагманский продукт PROMT Translation Server, который дорабатывается и дополняется новым функционалом в соответствии с требованиями клиента. В нем можно работать как через пользовательских интерфейс (в том числе через популярные веб-браузеры), так и через программный интерфейс, реализованный как кросс-платформенный веб-сервис. Отличительной особенностью работы с ФИПС является полная реализация всех возможностей, заложенных в продуктах серии PROMT Translation Server: перевод текста; перевод документов с сохранением форматирования; перевод документов, сохраненных в виде графического образа; терминологическая база и поиск по ней; настройка качества перевода; специальный перевод запросов, учитывающий структуру и правила построения запроса в поисковой системе; перевод с использованием пользовательского интерфейса и через API; гибкая авторизация (анонимная и персонифицированная).

В планах расширения функциональности платформы перевода ФИПС — подключение китайского и японского языков.

Татьяна Короткова