Программная нормализация справочников

Нормализуем любой корпоративный справочник эффективнее и дешевле традиционной ручной нормализации

Что такое программная нормализация НСИ?

playlist_add_check
Стандартизация записей справочника
с применением технологий распознавания данных и шаблонов нормативно-справочной информации (НСИ)
content_copy
Удаление дубликатов справочника
за счет автоматического сравнения данных с учетом синонимов, формата, типа и множества других факторов
cached
Улучшениепроцессов организации
благодаря внедрению регламентов ведения НСИ на основе лучших практик, учитывая специфику Вашей организации
attach_money
Увеличениерентабельности организации
за счет корректного учета складских остатков, блокировки лишней закупки, потребления ранее неучтенных запасов
Обычная
нормализация
SYNOPPS
Нормализация

playlist_add_check
Стандартизация
записей
Ручная обработка данных НСИ
Автоматическая обработка данных НСИ

done_all
Подтверждение
данных
Ручная проверка и подтверждение данных НСИ
Автоматическая проверка и подтверждение данных НСИ

content_copy
Удаление
дубликатов
Применение инструментов четкого и нечеткого сравнения записей
Сравнение значимых блоков записей, учитывая значения, формат и синонимы на 40% эффективнее

person
Человеческий
фактор
Ручное исправление данных повышает риск ошибок
Проверка автоматических исправлений минимизирует риск ошибок

timer
Срок
реализации
Зависит от объема ручной обработки
Зависит от объема проверки автоматической обработки в 2 раза быстрее

attach_money
Стоимость
услуги
Зависит от объема ручной обработки
Основана на меньших ресурсах, требуемых для проверки результатов в 2 раза дешевле
Аудит
Шаблоны
Нормализация
Экономия
Регламент

Обзор нашего подхода нормализации НСИ


1. Аудит справочника

Оценка данных НСИ оперативно и бесплатно

Проведем экспресс-анализ данных, выявим дубликаты и категории нормализации, определим необходимые трудозатраты и сроки для реализации проекта
Анализ данных справочника
  • Проверка на наличие ошибок
  • Проверка полноты данных
  • Поиск дубликатов
Разработка плана действий
  • Категоризация результатов
  • Планирование необходимых трудозатрат
  • Расчет сроков реализации
Индивидуальное предложение

2. Разработка шаблонов НСИ

Стандартизация структуры записей справочника

Разработаем документы, описывающие шаблоны НСИ, включая состав признаков, их порядок, форматирование и классификацию, которые обеспечат уникальность записи
Класс и подкласс Термины определяющие сущность записи
Каталожный номер и производитель Уникальный каталожный код и соответствующий ему производитель
Характеристики Значения определяющие характеристики записи
Классификаторы Корпоративные, общероссийские и международные классификаторы

3. Программная нормализация записей справочника

Автоматическое исправление ошибок справочника

Исправим более 10 000 ошибок в типовом справочнике из 60 000 записей
Исправление ошибок языковой раскладки
до:report_problemКартридж-тонер Canon FX10

после:check_circleКартридж-тонер Canon FX10
Замена непечатных символов
до:report_problemБолт (нерж. сталь, ½ NC 1-1/2)

после:check_circleБолт (нерж. сталь, 1/2 NC 1-1/2)
Удаление избыточных символов
до:report_problemПатрубок  радиатора ЗМЗ 409 

после:check_circleПатрубок радиатора ЗМЗ 409
Исправление синтаксических ошибок
до:report_problemЗаглушка сферическая ,ДУ-150

после:check_circleЗаглушка сферическая, ДУ-150
Замена букв используемых как цифры
до:report_problemКлей WBC Extra (О.5 кг) для стеклообоев

после:check_circleКлей WBC Extra (0.5 кг) для стеклообоев
Исправление орфографических ошибок
до:report_problemФилтр топливный (ФТ041-11050)

после:check_circleФильтр топливный (ФТ041-11050)

Программное распознавание значимых блоков и нормализация

Адаптивная система алгоритмов распознает более 220 000 значимых блоков в типовом справочнике для автоматической нормализации
Ненормализованная запись
Передний сальник 75х102х10мм 740-1005034 ГОСТ 8752-79запись справочника
  • Выявление класса и подкласса записи
  • Выявление характеристик и их значений
  • Выявление кодов и их вариаций
  • Выявление значений по ключевым словам
Распознанная запись
Переднийподкласс    сальниккласс    75х102х10ммхарактеристика    740-1005034код    ГОСТключ    8752-79гост
  • Подтверждение подлинности значимых блоков
  • Перераспределение порядка блоков согласно шаблону
  • Форматирование блоков согласно шаблону
  • Обогащение данных
Нормализованная запись
Сальниккласс    переднийподкласс    740-1005034код    75х102х10 ммхарактеристика    ГОСТключ    8752-79гост

Автоматический поиск дубликатов на основе распознанных блоков

Найдем более 7 000 дубликатов в типовом справочнике из 60 000 записей
Дубликат A
Сальниккласс    переднийподкласс    740-1005034код    75х102х10 ммхарактеристика    ГОСТключ    8752-79гост
  • Сравнение классов, учитывая синонимы
  • Сравнение кодов и их вариаций, без учета форматирования
  • Сравнение значений характеристик, а не их текстового представления
Дубликат B
Манжетакласс    УРАЛпроизводитель    740.1005034код    (  75,00*102,00*10,00характеристика ) 

4. Расчет экономии бюджета после нормализации НСИ

Расчет экономии бюджета и блокировка заявок на закупку

Рассчитаем прогноз складских остатков и предоставим список позиций, которые не следует закупать, для обеспечения многократной окупаемость проекта
График экономии на закупке после нормализации справочника

5. Разработка регламентов ведения НСИ

Регламентирование процессов для обеспечения качества НСИ

Разработаем документ регламентирующий работу с данными справочников – процессы управления записями НСИ
Заявитель - пользователь материалов, является инициатором
заявок ввода или редактирования записей справочника
Профильный специалист - ответственный за подразделение, проверяет
заявку на целесообразность
Эксперт НСИ - ответственный за справочник, проверяет
заявку на правильность заполнения и наличие дубликатов

Стоимость услуг нормализации НСИ

Оценка
Бесплатно
  • Оценка качества справочника
  • Оценка потенциального количества дубликатов
  • Оценка трудозатрат для реализации нормализации
Дубликаты
12,5 руб. за позицию
  • Оценка качества справочника
  • Оценка потенциального количества дубликатов
  • Оценка трудозатрат для реализации нормализации
  • Исправление ошибок и очистка данных
  • Выявление и подтверждение дубликатов
  • Блокировка лишней закупки и расчет экономии
Нормализация
25 руб. за позицию
  • Оценка качества справочника
  • Оценка потенциального количества дубликатов
  • Оценка трудозатрат для реализации нормализации
  • Исправление ошибок и очистка данных
  • Выявление и подтверждение дубликатов
  • Блокировка лишней закупки и расчет экономии
  • Приведение записей к единому стандарту
Нормализация +
50 руб. за позицию
  • Оценка качества справочника
  • Оценка потенциального количества дубликатов
  • Оценка трудозатрат для реализации нормализации
  • Исправление ошибок и очистка данных
  • Выявление и подтверждение дубликатов
  • Блокировка лишней закупки и расчет экономии
  • Приведение записей к единому стандарту
  • Подтверждение и дополнение данных НСИ
Тип услуги Оценка Дубликаты Нормализация Нормализация +
Оценка качества справочника
Оценка потенциального количества дубликатов
Оценка трудозатрат для реализации нормализации
Исправление ошибок и очистка данных -
Выявление и подтверждение дубликатов -
Блокировка лишней закупки и расчет экономии -
Приведение записей к единому стандарту - -
Подтверждение и дополнение данных НСИ - - -
Бесплатно 12,5 руб.
за позицию
25 руб.
за позицию
50 руб.
за позицию
Цены действительны до 31 декабря 2018 г.

Закажите бесплатный анализ справочника или задайте вопрос

Отправить
Спасибо за оставленную заявку.
Наши специалисты свяжутся с вами в ближайшее время.

Реализованные проекты

Обработка дубликатов НСИ

Очистка справочников и объединение дубликатов для Российской горнодобывающей компании
Заказчик

Горнодобывающее предприятие со справочником в 30 тыс. номенклатурных позиций. За годы работы было накоплено большое количество дубликатов из - за неправильного процесса ввода новой номенклатуры и, как следствие, наличие «лишней» закупки и дублированного складского остатка.

Предпринятые действия
  1. Данные обработаны автоматическим и ручным способами
  2. Проведена работа по подтверждению дубликатов с заявителями
  3. Изменен процесс ввода новой номенклатуры, обучен персонал
Достигнутые результаты
  • Определено, подтверждено и обработано 1500 дубликатов различных категорий программным и ручным способами
  • Определено и удалено 1666 технических дублей программным способом
  • Получено 8,5 млн. руб. экономии (1,5%) на одном бюджетном цикле
Заказчик

Международное горнодобывающее предприятие с несколькими активами в различных странах управляет централизованным справочником номенклатур с более чем 75 тыс. позиций. Отсутствие необходимой информации для существующих позиций и несогласованные процессы ввода новой номенклатуры привели к дублированию позиций, складских остатков и закупки.

Предпринятые действия
  1. Данные обработаны автоматическим и ручным способами
  2. Разработана матрица объединения дубликатов, учитывая склад, заявки и заказы
  3. Дополнена недостающая информация из различных источников (каталоги производителей и онлайн ресурсы), используя инструменты автоматизации
Достигнутые результаты
  • Около 50 тыс. позиций приведены в утвержденный стандарт номенклатуры с дополненной информацией
  • 4 тыс. позиций определены как дубликаты (~2 тыс. стали эталонами и ~2 тыс. дубликатов удалены). Процесс выявления эталона был автоматизирован и вместо ~1 недели ручной идентификации занял 3 минуты
  • Номенклатурный справочник сокращен на 19%

Нормализация справочника

Нормализация справочников для международной золотодобывающей компании с активами в нескольких странах

Оценка справочника

Оценка справочников вертикально интегрированного агрохимического комплекса на предмет дубликатов и качества данных
Заказчик

Вертикально интегрированный агрохимический комплекс c 250 тыс. позициями в централизованном номенклатурном справочнике, которому требовалось оперативно оценить качество данных, определить подход к нормализации и оценить трудозатраты для реализации проекта

Предпринятые действия
  1. Существующий алгоритм для обработки данных адаптирован, учитывая специфику данных заказчика
  2. Проведена автоматическая декомпозиция текстов описаний позиций на значимые блоки
  3. Позиции категорированы по типам дальнейшей обработки и подготовлен план по нормализации
Достигнутые результаты
  • План реализации с категориями нормализации, включая подход, сроки и необходимые ресурсы подготовлен за одну неделю
  • Определена доля дубликатов в справочнике
  • Разработан подход к очистке групп в справочнике