The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"В Firefox тестируют возможность распознавания текста на изображениях"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"В Firefox тестируют возможность распознавания текста на изображениях"  +/
Сообщение от opennews (??), 19-Авг-22, 20:07 
В ночных сборках Firefox началось тестирования функции оптического распознавания текста, позволяющей извлекать текст из размещённых на web-странице изображений, и помещать распознанный текст в буфер обмена или озвучивать для людей с ослабленным зрением при помощи синтезатора речи. Распознавание выполняется при выборе пункта "Copy Text from Image" в контекстном меню, показываемом при клике правок кнопкой мыши на изображении...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=57654

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Анонимemail (1), 19-Авг-22, 20:07   +/
Всё копируют у chromium'а...
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #2, #27, #49

2. Сообщение от dullish (ok), 19-Авг-22, 20:14   +11 +/
У яндекс браузера, же!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #25, #54

3. Сообщение от Аноним (-), 19-Авг-22, 20:24   +/
А картинки будут задавать по ссылке как свойство background в css, чтобы не копировали, что в итоге и так потребует расширения
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #10, #63

4. Сообщение от X86 (ok), 19-Авг-22, 20:31   +10 +/
Им бы скорость работы браузера допиливать, а не всякую побочку.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #8

5. Сообщение от Аноним (5), 19-Авг-22, 20:31   +11 +/
Капчу будет распознавать на морально устаревших сайтах.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #6, #61

6. Сообщение от Аноним (6), 19-Авг-22, 20:39   +1 +/
Это бан!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #53

7. Сообщение от user90 (?), 19-Авг-22, 20:51   –7 +/
Угу, попробовал я последнюю версию Фокса.. наглухо вешает систему нопремер, что не помогают никакие сочетания клавиш)) Нах-нах это "счастье".
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #12

8. Сообщение от Аноним (8), 19-Авг-22, 20:58   +1 +/
А какие претензии к скорости? Загрузи тяжёлую страницу в огнелисе и хроме, сравни, а потом говори про скорость.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4 Ответы: #24, #58, #66

9. Сообщение от Anonimemail (??), 19-Авг-22, 21:00   +1 +/
У них что, с функционалом интерфейса и темами оформления уже всё хорошо чтобы заниматься никому не нужной фигнёй?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #11, #30

10. Сообщение от Аноним (10), 19-Авг-22, 21:01   –2 +/
Здесь говорится об OCR - распознает любой текст , который отобразит браузер .
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3 Ответы: #23

11. Сообщение от Аноним (11), 19-Авг-22, 21:02   +1 +/
> никому не нужной фигнёй

Говорите за себя.
Уж в любом случае нужнее, чем пляски с темами.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #9 Ответы: #17, #40

12. Сообщение от Аноним (8), 19-Авг-22, 21:03   +6 +/
Пробовал я последнюю версию хромого, так он вообще выжигает дорожки на текстолите материнской платы!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #14

13. Сообщение от Kuromi (ok), 19-Авг-22, 21:06   +1 +/
"Реализация завязана на системные OCR API: VNRecognizeTextRequestRevision2 для macOS и Windows.Media.OCR для Windows. О планах по реализации возможности для Linux пока нет данных."

Эх, зачем сразу так обламывать? Штука так-то хорошая, иногда релаьно возникает необходимость по быстрому скопировать текст с картинки. Можно ли это реализовать под Линуксом? Наверное, какие-то же движки OCR есть, другой вопрос что 1) возня с интеграцией 2) качество распознования.
Предвижу что реализация фичи под Линукс ляжет в долгий ящик.

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #16, #28, #29, #36, #43

14. Сообщение от user90 (?), 19-Авг-22, 21:07   +/
Нах-нах НОВЫЕ версии, сижу на v91 и всем доволен ;)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #12 Ответы: #20

16. Сообщение от kusb (?), 19-Авг-22, 21:09   +/
Нефига, в Windows есть OCR API. Мне казалось это скорее отдельная программа. Интересно, какие ещё бриллианты там есть.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13 Ответы: #18

17. Сообщение от Аноним (10), 19-Авг-22, 21:11   +/
Так сейчас , что бы сделать с интерфейсом всё что угодно - нужны знания , а раньше поставил расширение - уже крутой . А что только выглядел крутым , а не был им - не важно . Главное показуха !
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11 Ответы: #59

18. Сообщение от Аноним (10), 19-Авг-22, 21:13   +/
Точнее - есть в Windows 10+ . И только там будет работать .
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16

20. Сообщение от Аноним (20), 19-Авг-22, 21:30   +/
https://www.opennet.ru/opennews/art.shtml?num=57644
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14

21. Сообщение от Аноним (21), 19-Авг-22, 21:33   +1 +/
капчу распознает?
Ответить | Правка | Наверх | Cообщить модератору

22. Сообщение от Аноним (22), 19-Авг-22, 21:35   +4 +/
А диски оно писать уже может?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #41

23. Сообщение от Аноним (23), 19-Авг-22, 21:43   +1 +/
Распознавание выполняется при выборе пункта "Copy Text from Image" в контекстном меню, показываемом при клике правок кнопкой мыши на изображении.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10 Ответы: #31

24. Сообщение от penetrator (?), 19-Авг-22, 22:20   +6 +/
Chrome немного быстрее, но все равно юзаю лису само собой.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #26

25. Сообщение от Аноним (25), 19-Авг-22, 22:26   +/
Разве яндекс не только на .com распознавает?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

26. Сообщение от Аноним (25), 19-Авг-22, 22:29   +/
Она восточногерманская? )
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #24 Ответы: #48

27. Сообщение от Аноним (-), 19-Авг-22, 22:49   +11 +/
> В ночных сборках Firefox началось тестирования функции оптического распознавания текста

А что там тестировать? Tesseract есть и давно работает. Или они свой велосипед клепают?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #34, #38

28. Сообщение от ИмяХ (?), 19-Авг-22, 23:11   +1 +/
В линуксе тебе надо -  ты и делай сам.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13

29. Сообщение от Аноним (29), 19-Авг-22, 23:27   +/
Распознавать можно всего тремя способами:

1) таскать распознавалку с собой

2) использовать то, что даёт ОС

3) отсылать изображение стороннему сервису


Первое - потребует колоссальной работы, обучения нейросеток, да ещё и поднимется вой "а почему в моём браузере это, я не не пользуюсь и не хочу"

Второе - в линуксах отсутствует

Третье - уже реализовано в виде дополнений

Других вариантов нет.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13 Ответы: #35, #62, #74

30. Сообщение от Songo (ok), 20-Авг-22, 01:53   +/
Ява скрипты обрабатываются мгновенно, рендеринг страниц такой, что гугл завидует, ресурсов совсем не жрёт. Теперь можно и новые функции пилить :))
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #9

31. Сообщение от Аноним (31), 20-Авг-22, 02:49   +/
- обновляем встроенную скриншотилкой кнопкой "распознать текст"
- объясням юзеру про это
- ...
- профит!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23 Ответы: #32, #47

32. Сообщение от Аноним (23), 20-Авг-22, 04:00   +2 +/
у тебя согласованность падежей хромает...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #31

33. Сообщение от Аноним (-), 20-Авг-22, 05:06   +3 +/
>Возможность пока включена только на платформе macOS

Действительно, зачем поддерживать хоть что-то, кроме смузи-огрызочной платформы, на которой сидят все "разработчики" Мозиллы? 🍎

Ответить | Правка | Наверх | Cообщить модератору

34. Сообщение от Cucumber (?), 20-Авг-22, 05:24   –17 +/
Тессеракт способен распознать только черный текст на белом фоне, и только когда шрифт из набора стандрартных. Что совсем не подходит для рандомных картинок в интернете. И это я пробовал только латиницу.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27 Ответы: #39, #65, #73

35. Сообщение от Аноним (23), 20-Авг-22, 06:40   +1 +/
> то, что даёт ОС

kernel.exe ничего не даёт. А либы по ocr и в лине есть внезапно для тебя.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29

36. Сообщение от Аноним (36), 20-Авг-22, 07:24   +/
В линуксе OCR через Tesseract в консоли делают, не думаю что его будут прикручивать к браузеру
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13 Ответы: #57, #69

38. Сообщение от Бывалый смузихлёб (?), 20-Авг-22, 08:04   +1 +/
Ну судя по тексту никакого тесеракта там нет - используются возможности ОСи.
Поэтому для ябблоси и винды включено а для линуксов и бздей - нет
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27

39. Сообщение от Аноним (-), 20-Авг-22, 08:37   –1 +/
Любую картинку можно до чернобелой преобразовать. И вообще, насколько часто это все надо чтобы вон то в браузер пихать? Может, туда еще чатик, почтарь, социалочку, калькулятор и платежную ситсему запхать? У китайцев если всего этого нет - вообще не программа. Хотя, погодите, Mozilla Suite что-то такое и делал...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #34

40. Сообщение от Аноним (-), 20-Авг-22, 08:41   +/
По-моему один хрен. Настраиваемость интерфейса угробили, дополнения стали бесполезными и клонируют хром, нормальную изоляцию браузера от системы в линухе ниасилили в отличие от хрома. И зачем оно такое надо, спрашивается? Как хром - только хуже. Да еще лажаются в каждой третьей версии. То UI сломают, то что-нибудь отваливается, то глюки новые. Они свою рыночную долю продолбали хрому вполне заслуженно. Кому этот кусок пародии на хром надо с дополнительным гемором?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11 Ответы: #50, #60

41. Сообщение от Аноним (-), 20-Авг-22, 08:43   +1 +/
Да, еще пусть последний директикс юзерам винды ставит. Какой же браузер без директикса. Можно еще дотнет приволочь. Не то чтобы он лисе нужен, но для солидности - самое то. Что за программа если весит меньше чем 1 сидюк?!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #22

43. Сообщение от 231 (?), 20-Авг-22, 09:08   +1 +/
Crow Translate - распознает и переводит текст, под линукс и виндовс. Нужные языки OCR нужно добавить в настройках.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13

45. Сообщение от Аноним (45), 20-Авг-22, 10:01   +1 +/
> Windows.Media.OCR

он локально распознаёт или через серверы microsoft?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #56

46. Сообщение от Аноним (46), 20-Авг-22, 10:20   +/
В macOS это дефолтная штука - и это истец как удобно
Ответить | Правка | Наверх | Cообщить модератору

47. Сообщение от Бывалый смузихлёб (?), 20-Авг-22, 12:01   +/
слишком сложно( тем более, что потребуется ещё какую-то область выбирать )
ведь гораздо проще просто определить элемент по которому кликнули и попытаться распознать картину которая в нём есть

а то, что элемент может быть прозрачным и изображение может содержаться в позади стоящем элементе - так кого беспокоят такие мелочи

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #31

48. Сообщение от Бывалый смузихлёб (?), 20-Авг-22, 12:03   +3 +/
сложная шутка. Кэп, на помощ!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #26

49. Сообщение от Аноним (49), 20-Авг-22, 12:46   +/
какая разница кто у кого чего копирует, главное чтобы эффективно работало
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

50. Сообщение от Аноним (11), 20-Авг-22, 13:15   +/
Модно подумать, настраиваемость и дополнения его бы спасли.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40

52. Сообщение от Аноним (52), 20-Авг-22, 14:51   +/
Всего за каких-то несколько лет ФФ стал таким, что по функционалу тот же яндекс браузер теперь никогда не догонит.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #55, #64

53. Сообщение от КО (?), 20-Авг-22, 15:04   +/
Лол, ну тут я сильно проиграл.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

54. Сообщение от Аноним (54), 20-Авг-22, 16:24   +/
ЯБ слижком общителен. Полчаса и сносишь с выражениямию😊
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

55. Сообщение от Аноним (23), 20-Авг-22, 16:52   +/
Естественно, что время, потраченное в мозиле на игры с растаманами, обратно не вернуть.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #52

56. Сообщение от Аноним (23), 20-Авг-22, 17:00   +/
> Windows.Media.OCR

OCR ... runs entirely on the device without requiring an Internet connection.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #45

57. Сообщение от Аноним (23), 20-Авг-22, 17:05   +/
> не думаю что его будут прикручивать к браузеру

И что мешает прикрутить libtesseract к браузеру?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #36 Ответы: #70

58. Сообщение от Аноним (-), 20-Авг-22, 17:30   +/
Вот кстати да, файрфокс побыстрее открывает тяжелые страницы в последнее время.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8

59. Сообщение от Аноним (-), 20-Авг-22, 17:33   +/
Мне главное, чтобы кнопка "домик" была на месте. ;)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #17

60. Сообщение от Аноним (-), 20-Авг-22, 17:34   +/
И вообще, надо ли настраивать интерфейс, если по умолчанию все нормально?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40

61. Сообщение от Аноним (-), 20-Авг-22, 17:35   +/
На опеннете чтоль? Да неплохо бы, одной кнопкой, и чтобы камент засылал автоматом.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5

62. Сообщение от Kuromi (ok), 20-Авг-22, 17:53   +/
> 3) отсылать изображение стороннему сервису
> Третье - уже реализовано в виде дополнений

Ты забыл добавить, что отсылать стороннему сервису = отсылась картинки с текстом неясной степени конфедициальности непонятно кому.

Мы ведь не знаем, ЧТО там за текст. Может быть это мемасик с гы-гы подписью, а могут быть какие-то контактные данные. Иногда картиночками показывают пароли или кодовые слова или еще что-то такое, именно для того чтобы НЕ копипастили.

Казалось бы "ну ты думай что и кому шлешь", но проблема "плагинов" что подсев на удобство можно забыть о осторожности.

Реализация "в МакОси" вроде как обрабатывает все локально...вроде как (в 21-ом веке ни в чем касательно приватности нельзя быть уверенным).

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29

63. Сообщение от Kuromi (ok), 20-Авг-22, 17:58   +/
> А картинки будут задавать по ссылке как свойство background в css, чтобы
> не копировали, что в итоге и так потребует расширения

Это не спасает от мотивированного пользователя. Все равно картинку можно выцепить через Pаge Info, если нет то есть Инспектор и наконец монитор сетевой монитор в девтулзах для самых упертых.
Как вариант загрузка картинки в Canvas сильно мешает доступу к ней, но и это не абсолют.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3

64. Сообщение от Kuromi (ok), 20-Авг-22, 17:59   +/
> Всего за каких-то несколько лет ФФ стал таким, что по функционалу тот
> же яндекс браузер теперь никогда не догонит.

Ну все таки одно дело пилить кастомизированный клон Хрома и другое - свой браузер.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #52

65. Сообщение от Варфоломей (?), 20-Авг-22, 19:01   +5 +/
У вас криокамера протекла. Еще полгода назад скармливал Tesseract совершенно рандомные цветные картинки с самым разным текстом и шрифтами (русскими), включая неоднородные тексты, разных стилей, размерой, с кучей всяких левых знаков и т.п. Finereader и рядом не валялся.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #34

66. Сообщение от X86 (ok), 20-Авг-22, 19:07   –1 +/
Все браузеры на основе chromium работают в разы быстрее. Надоели эти затупы при начале загрузки страниц. Только в Firefox так.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #67

67. Сообщение от Аноним (-), 20-Авг-22, 23:10   +/
У тебя наверно пентиум 2 до сих пор?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66 Ответы: #71

69. Сообщение от Аноним (69), 21-Авг-22, 15:35   +/
Вешаешь в xfce4-keyboard-settings на любимый шорткат шелл-скрипт, в котором:
1) Копируешь регион экрана в картинку: xfce4-screenshooter -r
2) Передаешь картинку в распознавалку: tesseract
3) Передаешь распознанный текст в системное уведомление (или куда удобно): notify-send
Работает с любым приложением, и не нужно ждать ебилдов.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #36

70. Сообщение от nebularia (ok), 22-Авг-22, 08:03   +/
То, что это не API, а конкретная реализация, в отличие от того, что в новости.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #57

71. Сообщение от X86 (ok), 23-Авг-22, 12:17   +/
> У тебя наверно пентиум 2 до сих пор?

У меня i7 12700f и память DDR5, а до этого был Ryzen 5 5600x

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #67

72. Сообщение от username (??), 23-Авг-22, 12:33   +/
как же хочется pwa..  да, есть на github от стороннего разработчика, но хочется штатную функцию
Ответить | Правка | Наверх | Cообщить модератору

73. Сообщение от Аноним (73), 23-Авг-22, 13:52   +/
4.1.1 нормально распознаёт текст с разноцветных картинок. Хотя к разбиению на абзацы есть претензии.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #34

74. Сообщение от Аноним (73), 23-Авг-22, 13:56   +/
Полно дополнений, которые включают реализацию libtesseract на js. Добавить libtesseract в браузер опциональной зависимостью — чисто организационная проблема.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру