Программа для ЭВМ «Цифровой инжиниринг:
Модуль оптического распознавания символов/
DigitalEngineering: Optical Character Recognition (OCR)»

Интеллектуальная конвертация изображения с текстом в массив данных в структурированном виде

Нейросеть для оптического распознавания

Для кого эта программа?
Программа представляет собой нейросеть для оптического распознавания. Интеллектуальный функционал, которым оснащена Программа, позволяет реализовать: оцифровку документов (перевод из растрового формата в векторный); разнесение оцифрованного описания детали по столбцам: полное наименование, краткое наименование, PN, DN, НТД, материал, масса единицы, количество, примечание; заполнение при выходе новой ревизии рабочей документации происходит путем копирования вкладки с предыдущей ревизией и ручным редактированием изменений. Область применения: EPCM-компании, промышленное строительство.
Программа представляет собой нейросеть для оптического распознавания. Интеллектуальный функционал, которым оснащена Программа, позволяет реализовать: оцифровку документов (перевод из растрового формата в векторный); разнесение оцифрованного описания детали по столбцам: полное наименование, краткое наименование, PN, DN, НТД, материал, масса единицы, количество, примечание; заполнение при выходе новой ревизии рабочей документации происходит путем копирования вкладки с предыдущей ревизией и ручным редактированием изменений. Область применения: EPCM-компании, промышленное строительство.
Для кого эта программа?
Получите структурированный массив данных из изображения
Получите структурированный массив данных из изображения
Что умеет делать программа?
В модуле OCR реализовано:

1. Интеграция с технологией компании ABBYY для базового распознавания спецификаций изделий, материалов и оборудования (СО, СА и др.), а также ведомостей трубопроводов (распознавание по неизменному шаблону).

2. Нейросеть для машинного обучения, позволяющая значительно повысить качество оптического распознавания символов и распознавать спецификации изделий, материалов и оборудования (различных разделов рабочей документации), выпускаемые различными проектными институтами, которые в свою очередь могут иметь различную форму, и данные в которых могут быть организованы по-разному (распознавание по изменяемым шаблонам).

3. Интеллектуальная обработка распознанной информации, которая заключается в анализе текстового массива данных, полученных из каждой ячейки; их преобразовании в структурированный вид (в спецификации несколько деталей одного вида могут иметь общее наименование); классификации и определении соответствия данных тому или иному техническому параметру детали (полное наименование, краткое наименование, PN, DN, НТД, материал, масса единицы, количество, примечание и другие) путем сопоставления текстового фрагмента со всеми возможными комбинациями написания (масками), характерными для этого технического параметра.

4. Полуавтоматическое создание электронных версий спецификаций изделий, материалов и оборудования (СО, СА и др.) при выходе новой ревизии рабочей документации путем копирования вкладки с предыдущей ревизией и ручным редактированием данных в соответствии с изменениями проектного института. Данный подход обеспечивает связь между одной и той же деталью, содержащейся в разных ревизиях документа, и в случае изменения ее технических или количественных характеристик актуализировать статусы по всем стадиям бизнес-процесса во всех АРМ (блокчейн-технология).

5. Справочник «Дюймы», справочник «Соответствия Ду, DN, резьб и диаметров», справочник «Материалы изготовления», справочник «Единицы измерения», справочник «Виды документации и виды деталей».
В модуле OCR реализовано:

1. Интеграция с технологией компании ABBYY для базового распознавания спецификаций изделий, материалов и оборудования (СО, СА и др.), а также ведомостей трубопроводов (распознавание по неизменному шаблону).

2. Нейросеть для машинного обучения, позволяющая значительно повысить качество оптического распознавания символов и распознавать спецификации изделий, материалов и оборудования (различных разделов рабочей документации), выпускаемые различными проектными институтами, которые в свою очередь могут иметь различную форму, и данные в которых могут быть организованы по-разному (распознавание по изменяемым шаблонам).

3. Интеллектуальная обработка распознанной информации, которая заключается в анализе текстового массива данных, полученных из каждой ячейки; их преобразовании в структурированный вид (в спецификации несколько деталей одного вида могут иметь общее наименование); классификации и определении соответствия данных тому или иному техническому параметру детали (полное наименование, краткое наименование, PN, DN, НТД, материал, масса единицы, количество, примечание и другие) путем сопоставления текстового фрагмента со всеми возможными комбинациями написания (масками), характерными для этого технического параметра.

4. Полуавтоматическое создание электронных версий спецификаций изделий, материалов и оборудования (СО, СА и др.) при выходе новой ревизии рабочей документации путем копирования вкладки с предыдущей ревизией и ручным редактированием данных в соответствии с изменениями проектного института. Данный подход обеспечивает связь между одной и той же деталью, содержащейся в разных ревизиях документа, и в случае изменения ее технических или количественных характеристик актуализировать статусы по всем стадиям бизнес-процесса во всех АРМ (блокчейн-технология).

5. Справочник «Дюймы», справочник «Соответствия Ду, DN, резьб и диаметров», справочник «Материалы изготовления», справочник «Единицы измерения», справочник «Виды документации и виды деталей».
Что умеет делать программа?