![]() |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Новая система оптического распознавания текста EasyOCR" | +/– | ![]() |
Сообщение от opennews (??), 08-Июл-20, 22:49 | ||
Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по ответам | RSS] |
1. Сообщение от Аноним (1), 08-Июл-20, 22:49 | +5 +/– | ![]() |
Годно, нужно, не тессерактом единым. Правда, у abby распознавание работало лучше, чем у тессеракта ещё 20 лет назад и это было до хайпа на нейронки. Тессеракт уже овер 500 лет развивается всякими гуглами, этот проект уже может с ним конкурировать, какие у него преимущества в наличии? У меня были проблемы с распознаванием китайского в тессеракте, даже в монохромных изображениях, гугл наверное использует что-то другое или он зажал нормальные модели. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #3, #8, #16, #25, #34 |
2. Сообщение от Erley (ok), 08-Июл-20, 23:22 | +/– | ![]() |
Было бы интересно узнать чем это лучше/хуже Tesseract | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #11, #13 |
3. Сообщение от Ivan_83 (ok), 08-Июл-20, 23:22 | –1 +/– | ![]() |
Я с ним совсем пало игрался, но мне помогло запскейлить изображение раза в 2-4 и потом уже скормить тессеракту. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 Ответы: #5 |
4. Сообщение от Аноним (45), 09-Июл-20, 00:58 | +/– | ![]() |
Насколько хорошо китайский распознает? Надо распознать хардсаб https://www.youtube.com/watch?v=MEQd_FJjuAU | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #6, #10 |
5. Сообщение от artenaki (ok), 09-Июл-20, 01:01 | +/– | ![]() |
Чтобы распознавалки хорошо распознавали надо чистить изображения от лишнего, как сказано здесь http://subs.com.ru/page.php?al=videosubfinder_hardsub | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 Ответы: #31 |
6. Сообщение от Аноним (45), 09-Июл-20, 01:07 | +/– | ![]() |
И корейский тоже https://www.youtube.com/watch?v=91g5n0FlbaE но тут, наверное, проще будет распознать французскую речь. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
7. Сообщение от Ingener (??), 09-Июл-20, 01:37 | –2 +/– | ![]() |
Во время 90х про программы Easy* шутили так - Изя*. Например Изя-поинт (EasyPoint). Сорри, просто вспомнил шутку. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #9, #22 |
8. Сообщение от Аноним (-), 09-Июл-20, 02:22 | +14 +/– | ![]() |
Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится... (да-да, знаю, свой движок ковыряйте сами, я про готовый продукт для конечного пользователя). С помощью FineReader я распознавал сотни книг еще в бородатых 90х... и это было мощь! Под Linux ни один проект до сих пор такого уровня распознавания не имеет, это один из немногочисленных минусов Linux, но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... За 27 лет могли бы озаботиться. Есть какие-то проекты, в т.ч. от гугла, но русский распознает там просто г**но - тестил на сотнях книг. Слишком уникальный и сложный софт, здесь только один игрок, который давно порешал весь рыночек, и Linux любовью обделил... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 Ответы: #12, #14, #15, #26, #54 |
9. Сообщение от Аноним (-), 09-Июл-20, 02:25 | +5 +/– | ![]() |
Русский не поддерживается... значит ненужно! | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #7 Ответы: #62 |
10. Сообщение от Аноним (10), 09-Июл-20, 02:28 | +1 +/– | ![]() |
Поставь, проверь, а заодно и нам расскажешь. ;) | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
11. Сообщение от Аноним (-), 09-Июл-20, 02:29 | +2 +/– | ![]() |
Хорошо бы... Когда узнаешь, возвращайся и расскажи нам. ;) | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #2 |
12. Сообщение от Аноним (1), 09-Июл-20, 02:57 | +3 +/– | ![]() |
Ну вообще-то, линукс поддерживается, просто это не та пользовательская приложуха. https://www.abbyy.com/ocr-sdk/technical-specifications/ | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #8 |
13. Сообщение от Аноним (13), 09-Июл-20, 03:11 | +/– | ![]() |
Написано же: "для определения и распознавания текста на изображении применяются методы машинного обучения". Распознавание символов -- это вообще буквально хелло-ворлд в теме NN, первое, чему обучаются нy6aри. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #2 Ответы: #21 |
14. Сообщение от iPony129412 (?), 09-Июл-20, 04:24 | –4 +/– | ![]() |
> но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #8 Ответы: #17 |
15. Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 08:14 | –4 +/– | ![]() |
> но ктож виноват, что разработчики FineReader такие жлобы | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #8 Ответы: #18, #24, #27, #45 |
16. Сообщение от апрар (?), 09-Июл-20, 08:18 | –2 +/– | ![]() |
Тессекракт просто текст ищет. Для индексирования это норм, но как для оцифровки документов это никочем. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 Ответы: #60 |
17. Сообщение от Аноним (17), 09-Июл-20, 08:39 | –4 +/– | ![]() |
> Десктопный линукс с 1-2% 🤷♂ | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #14 Ответы: #36 |
18. Сообщение от And (??), 09-Июл-20, 09:08 | +/– | ![]() |
Косяк в набросе - уж очень явное враньё. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 Ответы: #19, #32, #50 |
19. Сообщение от iPony129412 (?), 09-Июл-20, 09:37 | –1 +/– | ![]() |
Разработчики в курсе? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #18 Ответы: #30 |
20. Сообщение от Аноним (22), 09-Июл-20, 09:38 | +1 +/– | ![]() |
В приложениях для OCR основная проблема не распознавание сырого текста, а восстановление форматирования текста (включая таблицы и детектирование шрифтов, красныx строк и мягких переносов) и вычистка артефактов распознавания и печати. В этом ABBYY FineReader нет равных. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #28 |
21. Сообщение от Erley (ok), 09-Июл-20, 10:01 | +/– | ![]() |
Так Tesseract тоже на нейронках работает. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #13 |
22. Сообщение от Аноним (22), 09-Июл-20, 10:22 | +2 +/– | ![]() |
Программа не поддерживает ни иврит, ни идиш, поэтому для Изи она бесполезна. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #7 |
23. Сообщение от Аноним (23), 09-Июл-20, 10:28 | –1 +/– | ![]() |
>Новая система оптического распознавания текста EasyOCR | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
24. Сообщение от Аноним (24), 09-Июл-20, 10:56 | +2 +/– | ![]() |
>> но ктож виноват, что разработчики FineReader такие жлобы | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 Ответы: #51 |
25. Сообщение от Аноним (25), 09-Июл-20, 11:01 | +/– | ![]() |
Просто тесеракт надо уметь готовить (обучать самому) и будет сносно работать. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 |
26. Сообщение от artenaki (ok), 09-Июл-20, 11:09 | +/– | ![]() |
> Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #8 Ответы: #29 |
27. Сообщение от artenaki (ok), 09-Июл-20, 11:13 | +1 +/– | ![]() |
Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто так придумали, спросите Зенитара. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 Ответы: #44 |
28. Сообщение от Аноним (25), 09-Июл-20, 11:14 | –2 +/– | ![]() |
В гимпе порежь на кусочки как нравится распознай отдельно, а потом вставь форматированно отдельно в либреофис. Что характерно и для гимпа и для либры можно написать плагины для этого, но почему-то этим не заморочился. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #20 Ответы: #53 |
29. Сообщение от artenaki (ok), 09-Июл-20, 11:18 | +/– | ![]() |
Проверьте сами, если не верите https://finereaderonline.com/ru-ru | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 Ответы: #35 |
30. Сообщение от Клыкастый (ok), 09-Июл-20, 11:56 | +2 +/– | ![]() |
> Разработчики в курсе? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #19 Ответы: #37, #38, #40 |
31. Сообщение от анон (?), 09-Июл-20, 12:30 | –1 +/– | ![]() |
Теряется шум от букв, а это уже важная информация. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #5 |
32. Сообщение от апрар (?), 09-Июл-20, 12:34 | –1 +/– | ![]() |
балабол. Собери, запакеть и поддерживай еще под каждый дистр сперва, а есть еще и роллинги... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #18 |
33. Сообщение от прототипы (?), 09-Июл-20, 12:38 | +1 +/– | ![]() |
Python? Господь простит... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #59, #61 |
34. Сообщение от анон (?), 09-Июл-20, 12:40 | +/– | ![]() |
У адоба оцр в несколько проходов, это даже видно по времени и загрузке ядер. И да, у меня есть огромное количество текстов, которые может прочитать человек, но даже адоб не справится с половиной, но вот все остальное - без проблем. Я даже специально портил тексты, чтобы понять, что лучше справится, чтобы быть уверенным в том, что перечитывать не придется. Ответ - все распознают одинаково ужасно. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 |
35. Сообщение от анон (?), 09-Июл-20, 12:43 | +/– | ![]() |
> Без Windows не обойтись | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #29 |
36. Сообщение от хотел спросить (?), 09-Июл-20, 12:49 | +6 +/– | ![]() |
яки ён табе бацька, сабака? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #17 |
37. Сообщение от iPony129412 (?), 09-Июл-20, 13:11 | –2 +/– | ![]() |
> хомяки, смузихлёбы, розовыхявапоней | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #30 Ответы: #39, #46 |
38. Сообщение от iPony129412 (?), 09-Июл-20, 13:17 | +/– | ![]() |
> тоже есть баги XP-w7-32/64 и прочие специфичные. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #30 |
39. Сообщение от artenaki (ok), 09-Июл-20, 13:25 | +/– | ![]() |
> XP-нутых вообще сразу посылать | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #37 Ответы: #41 |
40. Сообщение от iPony129412 (?), 09-Июл-20, 13:25 | –1 +/– | ![]() |
Потому что ты думаешь не головой а другим местом. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #30 Ответы: #47 |
41. Сообщение от iPony129412 (?), 09-Июл-20, 13:29 | +/– | ![]() |
> Вон две какие подделки есть, а ещё Total Commander собирают под Windows XP | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #39 Ответы: #42, #43 |
42. Сообщение от artenaki (ok), 09-Июл-20, 13:42 | +/– | ![]() |
Что исключение? Еще множество софта XP поддерживает, это факт. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #41 |
43. Сообщение от artenaki (ok), 09-Июл-20, 13:48 | +/– | ![]() |
> две какие подделки есть | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #41 |
44. Сообщение от Аноним (24), 09-Июл-20, 13:49 | +1 +/– | ![]() |
> Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #27 |
45. Сообщение от Аноним (45), 09-Июл-20, 14:44 | +/– | ![]() |
Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 Ответы: #52 |
46. Сообщение от Клыкастый (ok), 09-Июл-20, 17:20 | +/– | ![]() |
> А разработчикам это как-то не сдалось. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #37 Ответы: #48 |
47. Сообщение от Клыкастый (ok), 09-Июл-20, 17:53 | +/– | ![]() |
Ты меня явно с кем-то путаешь. И про Pidgin с бровями - не ко мне, и опенсорс сообщество я далеко не идеализирую. Вопрос совершенно простой - вой про ужасный линукс, под который "нормальные конторы" разрабатывать не могут - это вой не про линукс, а про отрицание новых подходов и традиций (которые - есть) на новом рынке (насколько он интересен - вопрос второй). При чём если рынок неинтересен, так и разговор короткий, и спорить не о чем. А вот длинные и мутные описания проблем чаще всего пузырьки над глубинным "не хочу учиться/меняться/осваивать". При чём если посмотреть что коммерсанты осваивали и заставляли сотрудников осваивать, так в общем багтрекеры с гитами и не проблема вовсе. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #40 Ответы: #49 |
48. Сообщение от iPony129412 (?), 09-Июл-20, 17:59 | +/– | ![]() |
> Активно используют. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #46 |
49. Сообщение от iPony129412 (?), 09-Июл-20, 18:05 | –1 +/– | ![]() |
> Ты меня явно с кем-то путаешь. И про Pidgin с бровями не ко мне | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #47 Ответы: #57 |
50. Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:32 | –2 +/– | ![]() |
> Косяк в набросе - уж очень явное враньё. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #18 Ответы: #58 |
51. Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:34 | –1 +/– | ![]() |
> опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #24 Ответы: #55 |
52. Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:36 | –1 +/– | ![]() |
> Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #45 |
53. Сообщение от Аноним (-), 09-Июл-20, 21:08 | +2 +/– | ![]() |
Сам нарезай, извращенец... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #28 |
54. Сообщение от Аноним (54), 09-Июл-20, 21:11 | –2 +/– | ![]() |
И что характерно: с 12по 15 версию даже по Вайном не запускается. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #8 |
55. Сообщение от elsin (?), 09-Июл-20, 22:22 | +1 +/– | ![]() |
https://www.winehq.org/ так вот же фотошоп, МСО или файнридер | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #51 Ответы: #56 |
56. Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 23:55 | +/– | ![]() |
> https://www.winehq.org/ так вот же фотошоп, МСО или файнридер | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #55 |
57. Сообщение от Клыкастый (ok), 14-Июл-20, 21:02 | +/– | ![]() |
> А да, перепутал и аватарки и риторика детского максимализма похожа. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #49 |
58. Сообщение от Клыкастый (ok), 14-Июл-20, 21:15 | +/– | ![]() |
> Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #50 |
59. Сообщение от artenaki (ok), 17-Июл-20, 00:22 | +/– | ![]() |
Стреляйте в пианиста. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #33 |
60. Сообщение от надоело (?), 18-Июл-20, 12:13 | –1 +/– | ![]() |
> Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и.... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #16 |
61. Сообщение от надоело (?), 18-Июл-20, 12:15 | +/– | ![]() |
Напиши на pure С, лoх чтоли? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #33 |
62. Сообщение от надоело (?), 18-Июл-20, 12:17 | –1 +/– | ![]() |
Тебе всe равно китайский учить в скором времени, так что пофиг. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #9 |
64. Сообщение от gilbertelyhopper (ok), 04-Сен-22, 06:37 | +/– | ![]() |
OCR — действительно крутая технология, я также знаю сайт, где они неплохо используют оптическое распознавание. Я также регулярно использую его на работе, это бесплатно и онлайн. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |