Сообщество
FAQ
Логин
Пароль
Войти при помощи
Кстати, вы можете
Установить drebedengi.ru на свой сервер.
Общение / Веб версия / Автоматическое распознавание чеков

Автоматическое распознавание чеков

Stonekeeper
11 марта 2015 10:35
Добрый день.
Не знаю предлагалось ли это ранее и если честно, то читать как-то лень=) Заранее прошу прощения, если повторю уже высказанное предложение.

Суть предложения в заголовке. Уточню несколько важных моментов (не все обязательные, но вкупе они позволят многое).

Технические моменты:
1. Автоматическое распознавание поля "Итого" в чеке - наиболее простая задачка. Обычно оно в конце и выделено самым жирным шрифтом.
2. Распознавание позиций по чеку уже требует формирования некоторого типового шаблона для каждого типа чеков (например, в каждой торговой сети чеки унифицированы).
3. Конечно же, для реализации п.1-2 требует наличия на серверной стороне ПО распознавания текста и собственные наработки реализующие функционал п.1-2.
4. Для занесения автоматически обработанного чека предлагаю использовать отдельную форму, на которой выводить:
- Распознанные позиции с облаком рекомендуемых категорий (об этом чуть ниже), в тег записывать наименование позиции и ссылку на фото чека. С возможностью скорректировать или удалить позицию.
- Строку для добавления нераспознанных трат
- Общую сумму чека
- Источник траты по чеку.
- Ссылку на удаление всех позиций.
Если пользователь нажимает сохранить и сумма позиций не совпадает с общей суммой, то система спрашивает что сделать: скорректировать общую сумму или добавить трату с категорией по умолчанию.
5. Для формирования облака рекомендуемых категорий вижу два пути:
5.1 На основе истории пользователя. Т.е. для каждого пользователя формировать базу с привязкой категорий к наименованиям позиций в чеках.
5.2 На основе единой базовой иерархии категорий (она должна быть достаточно подробной). Т.е. выводить топ категорий, к которым пользователи сервиса привязывали за последнее время конкретную позицию. В этом случае пользователю в настройках сначала придется создать соответствие между своими категориями и базовой иерархией.

Организационные моменты:
1. Для стимулирования пользователей можно за активное использование чеков начислять баллы, которые потом тратить на оплату сервиса.
2. Быть может для обучения алгоритма распознавания потребуется работа людей и тут опять же можно задействовать пользователей сервиса. Например, пользователь размечает чек (наименование, цена, количество, сумма по каждой позиции, блок-заголовок, блок Итого: ключевое слово и сумма, блок завершения и т.п.), а за это опять же получает баллы.

Для сервиса, кроме расширения функционала, вижу два пути монетизации:
1. Мониторинг цен на продукты в продуктовых сетях. Сеть и название конкретного магазина как правило можно "вытащить" из заголовка чека.
2. Огромный объем статистических данных с детализацией по всем параметрам в настройках аккаунта. А туда можно добавить все стандартные социологические категории о возрасте, составе семьи, среднем доходе и т.п. За заполнение профиля опять же давать баллы. Эта статистика - качественный товар, который вполне можно продать сам по себе.
Admin
11 марта 2015 11:10
Здравствуйте.
Спасибо за предложение. Тема обсуждается время от времени, в прошлом у нас даже была такая услуга (вручную, через операторов). Но оказалась не востребованной.

Автоматическое распознавание - увы, мы пока далеки от этого. Чеков такое разнообразие, и не всегда даже человек способен их распознать :). "Итого" - да, попроще, возможно ещё вернёмся к этой задаче.
Stonekeeper
11 марта 2015 11:36
Не обязательно сразу и все. Даже более того, понятно, что все чеки никогда не получится автоматически распознавать по различным техническим причинам (качество фото, неизвестный формат чека и т.п.).
Я потому и написал по торговые сети и шаблоны. В большинстве своем эта функция необходима для чеков из гипермаркетов и продуктовых магазинов, т.к. в них наибольшее разнообразие в категориях товаров. И те и другие сейчас, как правило принадлежат какой-то сети, внутри которой форма чеков одинакова. Плюс типовые чеки по самым распространенным кассовым аппаратам.

Реализуйте распознавание для них и вы закроете две трети потребностей в этом направлении. При этом пользователю не придется платить, в отличии от доп.услуги через операторов, которая наверняка стоила не дешево да и качеством не всегда были довольны.

Для остальных магазинов разнообразие категорий в подпунктах невелико, а зачастую и вообще нет: в магазине одежды можно купить только одежду, в кафе можно только поесть/отдохнуть и т.п. В этих случаях хватит и автоматического "итого", а в строке с нераспозанными тратами пользователь просто выберет нужную категорию и нажмет сохранить.
alexdumper
12 марта 2015 16:33
Автоматичекое распознавание чека та еще задачка. Ее решение можно отдельным продуктом выставлять.
Pavel
20 июля 2016 12:00
Добрый день.

Подскажите, пожалуйста, планируйте ли вы добавлять функцию распознования чеков? Год назад предложение вносилось и ничего к сожалению не сделано. Посмотрите у ваших конкурентов, уже есть предложения на рынке. Я не хочу указывать конкретные продукты, все гуглится.
Admin
20 июля 2016 12:05
Pavel Пишет:
планируйте ли вы добавлять функцию распознования чеков?
Нет, пока не планируем. Но внимательно следим за этой темой.
Роман
27 июля 2016 18:40
Можно сторонний сервис использовать: https://rucaptcha.com/support/faq/29/ Мне правда было бы актуальнее аудиозаметки расшифровывать.
Vladimir
29 июля 2016 14:56
имхо утопия, особенно учитывая, что Drebedengi используют люди из разных стран, где кассовые чеки не обязательно на русском языке.
Чтобы отвечать на сообщения - зарегистрируйтесь и войдите в личный кабинет.
© drebedengi.ru 2007 - 2017  |  Мобильная версия  |  Карта сайта  |  API интеграции  |  Обратная связь  |   English