The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]



"Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о пользователе из открытых источников"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о пользователе из открытых источников"  +/
Сообщение от opennews (??), 07-Ноя-21, 19:11 
Опубликован выпуск проекта Snoop 1.3.1, развивающего криминалистический OSINT-инструмент, который разыскивает учётные записи пользователей в публичных данных (разведка на основе открытых источников). Программа анализирует различные сайты, форумы и социальные сети на предмет наличия искомого имени пользователя, т.е. позволяет определить на каких сайтах имеется пользователь с указанным ником. Проект разработан на материалах исследовательской работы в области скрапинга публичных данных. Сборки подготовлены для Linux и Windows...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=56120

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноним (1), 07-Ноя-21, 19:11   +6 +/
Несвободная лицензия, уничтожить
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #2

2. Сообщение от QwertyReg (ok), 07-Ноя-21, 19:15   –26 +/
Поддерживаю, давайте уничножим всё ПО с несвободными лицензиями (99% всего софта). Будем играть в TuxRacer на тормозном Linux Libre.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #47, #51

3. Сообщение от Аноним (3), 07-Ноя-21, 19:16   +/
Пока ты вроде Бонда 007, а потом совсем прихлопнут страничку поисковика и останется лишь адресная строка.
Ответить | Правка | Наверх | Cообщить модератору

4. Сообщение от QwertyReg (ok), 07-Ноя-21, 19:17   +4 +/
Мне больше нравится то, что даже для Linux пакет оформлен в rar-архив. Лол.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #49, #55, #84

5. Сообщение от Ю.Т. (?), 07-Ноя-21, 19:30   +2 +/
"скрапинг" это уничтожение, утилизация
"скрейпинг" это скобление, сбор с поверхности
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #6

6. Сообщение от Аноним (6), 07-Ноя-21, 20:00   +2 +/
Ты бы лучше исходник привёл: scrap и scrape, а то транскрипция хромает.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #11

7. Сообщение от Аноним (7), 07-Ноя-21, 20:00   +2 +/
Слава богу хоть тут я аноним. И клево то, что во первых я нигде никогда не регистрировался под реальным именем, а соответствие между ником и реальным именем, как обычно, вилами на воде писано. Ну и плюс где я зареган под нормальным ником, там я пишу только нормальные вопросы по делу. Эти посты не содержат личной информации и могут только позволить определить, кем я работаю и чем занимаюсь, для чего не нужно быть следователем. Троллю я под другими никами. Попробуйте поймайте.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #8, #9, #42

8. Сообщение от QwertyReg (ok), 07-Ноя-21, 20:04   –4 +/
> я нигде никогда не регистрировался под реальным именем

Да вы просто уникум. Никогда такого не видел.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #10

9. Сообщение от чукумота (?), 07-Ноя-21, 20:09   +1 +/
А Tails умеешь юзать, Джо?
По nlp анализу тебя поймают.

Софт прикольный, на Android 9 встал с первого раза.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7

10. Сообщение от Аноним (7), 07-Ноя-21, 20:10   +2 +/
Речь идет ведь об открытых источниках? Т.е. о форумах и т.д. Есть не так уж много людей в здравом уме и доброй памяти, которые регистрируются где попало под своим ФИО вместо ника. А ник это такая штука, как телеметрия без аккаунта. Нет 100% доказательств, что это именно тот человек. И это. Я познакомился с интернетом еще в те времена, когда анонимность была нормой и достаточно было только ника. Всякая регистрация по телефону пошла уже потом. У меня даже в личной почте не указаны реальные ФИО. И даже в гугл аккаунте на телефоне.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #12, #48, #95

11. Сообщение от Ю.Т. (?), 07-Ноя-21, 20:20   +1 +/
> Ты бы лучше исходник привёл: scrap и scrape, а то транскрипция хромает.

Это вот в новости и не исходник, и транскрипция хромает.

PS Если что, то "точно повторять звучание" (в транскрипции) это утопия.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6 Ответы: #73

12. Сообщение от тов. майор (?), 07-Ноя-21, 20:21   +/
> Нет 100% доказательств, что это именно тот человек.

с помощью бутылки от шампанского, ручки от швабры и резиновой дубинки я могу доказать все что угодно - что люди ходят на руках, и что люди ходят на боках в том числе.

А твое фио мне даст провайдер. Вместе со сканом паспорта и адресом.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10

30. Сообщение от MaDDoG2000 (ok), 07-Ноя-21, 20:38   +/
Чем отличаеться от theHarvester ?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #115

42. Сообщение от Аноним (42), 07-Ноя-21, 21:35   +/
Вот воспользуется следователь данной программой и будешь отвечать за комментарии всех анонимов ) Тем более опеннет там в базе есть
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #45, #114

43. Сообщение от Аноним (-), 07-Ноя-21, 21:43   +/
1560. 🇷🇺 Opennet он и вас посчитал...
скотство какое-то - ПО для разнюхивания, опознавания рож и т.п.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #101, #116

44. Сообщение от тов. майор (?), 07-Ноя-21, 21:44   +/
> Смешной ты. Типа всё можешь, а на самом деле ты ничто.
> Тут Анонимов больше чем Ивановых и Кузнецовых вместе взтых.

и чем это им поможет? Адресочки-то вот они...

Но "тут" действительно дурацкий сайт, ловить врагов лучше и удобнее там где от них требуют подтвержденный оператором телефонный номер с паспортом. В принципе, таких сейчас почти все.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #82 Ответы: #83

45. Сообщение от тов. майор (?), 07-Ноя-21, 21:45   +/
> Вот воспользуется следователь данной программой и будешь отвечать за комментарии всех анонимов

Ну всех-то зачем же? Только тех которые мне нужны для дела.
Я их сам, кстати, и напишу.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #42

46. Сообщение от Аноним (47), 07-Ноя-21, 23:31   +/
Проприетарному ПО на OpenNet не место, IMHO.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #50

47. Сообщение от Аноним (47), 07-Ноя-21, 23:34   +8 +/
В госдуму избираться не планируете? Если вся ваша программа сводится к этому пункту, то я бы за вас проголосовал.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #64, #75

48. Сообщение от Андрей (??), 07-Ноя-21, 23:58   +/
Да пока ты тот самый Джо Неуловимый, можешь оставаться в счастливом неведении.

А как только твоя задница кому нужна станет, найдут. И сам удивляться будешь как и в какой срок тебя нашли.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10

49. Сообщение от Ordu (ok), 08-Ноя-21, 00:40   +1 +/
Ты в issues загляни. Там 2 issues и оба про права на файлы. Один о том, что установщик пытается писать в C:/snoop, второй о том, что он распаковывает на linux'е файлики типа css и mp3, вешая на них бит executable.

Какие-то вылезшие из криокамеры старпёры писали. Или, альтернативно -- это троян, который пытается выцыганить из пользователя рутовские привилегии и маскирует вредоносный код в mp3.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

50. Сообщение от псевдонимус (?), 08-Ноя-21, 01:32   +2 +/
Кроме солярки, конечно)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #46 Ответы: #110

51. Сообщение от Ivan_83 (ok), 08-Ноя-21, 01:41   +/
Нету столько проприетарного софта, если мы конечно про живой софт который до сих пор хотя бы кто то собрать может.
Сами прикиньте: у фри в портах порядка 25к портов, пусть чисто софта из них будет даже 5к (всмысле сама прога, а не либа/шфрит/тема), хотите сказать что закрытого софта наберётся под 500 тыщ?
Не верю!
Даже со всякой дохлятиной столько никогда под венду не было.
Разумеется не будем считать студенческие поделки для самого себя которые никогда не публиковались.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #58

52. Сообщение от z280 (?), 08-Ноя-21, 02:09   +/
я на разные сайты захожу с разных браузеров
Ответить | Правка | Наверх | Cообщить модератору

53. Сообщение от Аноним (53), 08-Ноя-21, 03:18   +/
Пишу под своим ником с разных людей
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #54

54. Сообщение от Shevchuk (ok), 08-Ноя-21, 04:13   +2 +/
Пишу под своим человеком с разных сайтов.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #53 Ответы: #86

55. Сообщение от Аноним (55), 08-Ноя-21, 05:45   –10 +/
Уж лучше RAR чем говняный tar с надстройкой - худшее, что есть в мире Linux. Надеюсь хоть к моей старости эту окаменелость закопают и перейдут на что-то нормальное типа 7z.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4 Ответы: #56, #57

56. Сообщение от Аноним (56), 08-Ноя-21, 06:02   +1 +/
7z шляпа поконченная, теряет почти все метаданные. Плохой формат. Тар сохраняет всё без потерь, что намного лучше. Lrzip кстати эффективнее 7z жмёт, потому что он дедуплицирует одинаковые данные в тарболе, и 7z дедуплицирует только ближайшие пол гига (зависит от словаря), хотя там тот же lzma (среди прочего).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #55 Ответы: #92

57. Сообщение от Аноним (56), 08-Ноя-21, 06:04   +/
Рар это вендузячнечиство, формат хорош для повреждённых архивов из-за встроенного парити -- позволяет восстановить все данные при определённом проценте повреждений. Но так он всем хуже.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #55 Ответы: #60

58. Сообщение от k1801 (ok), 08-Ноя-21, 06:24   +1 +/
> Нету столько проприетарного софта
> Сами прикиньте: у фри в портах порядка 25к портов, пусть чисто софта
> хотите сказать что закрытого софта наберётся под 500 тыщ?
> Не верю!

Да в одной только библиотеке Steam свыше 50000 игр. Не дополнений, не dlc, только самих игр там в два раза больше, чем ВСЕГО пакетов у этой вашей фряхи, и в ДЕСЯТЬ раз больше, чем ваша оценка количества программ. Добавьте сюда профессиональный софт - и у вас только КОМПАНИЙ, производящих такой софт, будет ещё пара сотен тысяч. Драйвера к устройствам? Не-стимовские игры? И вот количество программ уже на миллионы пошло.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #51 Ответы: #62, #79

59. Сообщение от Аноним (56), 08-Ноя-21, 06:40   +2 +/
А можно прикрутить стилистический анализ речи? Нейронки сейчас вроде хороши для этого. Потому что имена ни о чём не говорят как правило, пустая трата времени. С целью фоловить известные аккаунты у меня свои костыли уже есть, но вот находить неизвестные было бы интересно.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #66

60. Сообщение от Аноним (60), 08-Ноя-21, 07:16   +/
> формат хорош

а безопасен ли?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #57 Ответы: #61, #85

61. Сообщение от Аноним (56), 08-Ноя-21, 07:21   +/
Была уязвимость с исполнением кода в прошлом году. Вроде даже не одна. Парити спасает в случае минорного битрота, но не поможет при битой памяти. Одна из тех вещей которые лучше иметь, чем не иметь. Однако par2 тоже ничего на самом деле.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #60

62. Сообщение от n00by (ok), 08-Ноя-21, 07:58   –2 +/
> Да в одной только библиотеке Steam свыше 50000 игр.

...
> Добавьте сюда профессиональный софт

50000 редакторов кода и фотошопов? Где Вы их видели?

> у  вас только КОМПАНИЙ, производящих такой софт, будет ещё пара сотен тысяч.

А у Вас не будет, потому Вы и постеснялись привести пруф количества компаний?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58 Ответы: #96

64. Сообщение от Тот_Самый_Анонимус (?), 08-Ноя-21, 08:14   +2 +/
Зачем голосовать? Страдай в одиночку, или одному не комильфо, и хочется принудить всех?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #47 Ответы: #72

65. Сообщение от Аноним (65), 08-Ноя-21, 08:16   +/
Забавно что опеннет есть, а лора нет)))
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #71

66. Сообщение от n00by (ok), 08-Ноя-21, 08:21   +/
Для некоторых хватит и частотного анализа. "Все знают", "всем плевать" - это не стилистика. Примечательно, что одного фанатика, который с умным видом некогда отрицал наличие спектра в текстах, я именно по таким маркерами здесь и деанонимизировал.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #59 Ответы: #67, #74

67. Сообщение от Аноним (56), 08-Ноя-21, 08:24   +1 +/
Я скорее про особенности пунктуации, повторяющиеся ошибки, и прочее такое. Это подделать сложнее, чем изменить манеру речи.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66 Ответы: #68

68. Сообщение от n00by (ok), 08-Ноя-21, 08:28   +1 +/
А я про способ реализации. Стилистика - это человеку понятно, но как формализовать? Повторение ошибок суть частота и есть. Частотным анализом устанавливали авторство текстов Брежнева, насколько я знаю.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #67 Ответы: #69

69. Сообщение от Аноним (56), 08-Ноя-21, 08:42   +/
Допустим, если человек часто использует редко встречаемые или устаревшие слова, это определённо аномалия. Если он постоянно любит поднимать какую-либо тему, или известный ему пример. Необходимо анализировать всё в совокупности, нельзя получить сколько-нибудь правдоподобный результат полагаясь на один метод. И, по-моему, насчёт текстов Брежнева, никакой определённости до сих пор нет.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #68 Ответы: #70, #97

70. Сообщение от n00by (ok), 08-Ноя-21, 09:18   –1 +/
Редко, часто, постоянно - это всё про частоту. При этом порядок слов в первом приближении можно не учитывать.

Что касается Брежнева, то кто мы такие, что бы судить величайшего из великих? ;)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #69 Ответы: #77

71. Сообщение от pivovarov (?), 08-Ноя-21, 09:20   +/
Вроде и Лор есть
1265. 🇷🇺  LOR
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #65

72. Сообщение от QwertyReg (ok), 08-Ноя-21, 10:25   –3 +/
> Зачем голосовать? Страдай в одиночку, или одному не комильфо, и хочется принудить
> всех?

Вы только что попали в самое яблочко. Это же мотивация всех Linux-фанатиков.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #64

73. Сообщение от Аноним (6), 08-Ноя-21, 10:27   +/
> "точно повторять звучание" (в транскрипции) это утопия.

К сожалению, есть такие утописты, топящие за МицубиЩи и ХироЩиму, при этом не могут сослаться ни на один действующий стандарт...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11 Ответы: #82

74. Сообщение от Аноним (6), 08-Ноя-21, 10:31   +/
Копипасту как будешь идентифицировать?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66 Ответы: #76

75. Сообщение от QwertyReg (ok), 08-Ноя-21, 10:32   –1 +/
> В госдуму избираться не планируете? Если вся ваша программа сводится к этому пункту, то я бы за вас проголосовал.

А вы такой весь из себя мамкин противник закрытого кода? Тогда что вы делаете на сайте, исходники которого закрыты? Вам самому не рофляно, что вы разглагольствуете о СПО на сайте, не являющимся СПО?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #47

76. Сообщение от n00by (ok), 08-Ноя-21, 11:01   +1 +/
Некоторых можно идентифицировать по глупым вопросам.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #74 Ответы: #78, #98

77. Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 11:32   +/
не постоянно, а повторяюще, и сразу возникает вопрос как быть с копипастой? по факту у вас только один экземпляр текста получается, и не факт, что дважды написанный текст написан одним человеком.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #70 Ответы: #80

78. Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 11:34   +/
лучше провести эксперимент, меняйте ники и пишите коменты
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #76 Ответы: #81

79. Сообщение от Аноним (79), 08-Ноя-21, 11:34   –1 +/
99,999% из них никому не нужно.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58

80. Сообщение от n00by (ok), 08-Ноя-21, 11:49   +/
> не постоянно, а повторяюще

Повторяюще, при каждом измерении, контакт питания в USB коннекторе показывает 5 Вольт, потому и называется источником постоянного тока. :)

> и сразу возникает вопрос как быть с копипастой?

У меня не разу не возникал.

> по факту у вас только один экземпляр текста получается, и не
> факт, что дважды написанный текст написан одним человеком.

Так для частотного анализа одного сообщения маловато.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #77 Ответы: #87

81. Сообщение от n00by (ok), 08-Ноя-21, 11:57   +/
Можно и по никам идентифицировать. Один Анон как-то принялся за мной активно бегать, я запретил ответы Аноним-у. Тот принялся писать с никах всякую чушь :) В том числе буквально https://www.opennet.ru/~%CD%C1%D3%D3....
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #78

82. Сообщение от Аноним (56), 08-Ноя-21, 12:27   +/
Досирак же.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #73 Ответы: #44

83. Сообщение от Аноним (83), 08-Ноя-21, 13:00   –1 +/
Ну вот ты и сдулся. Типичный позер.
Да и ещё как модератор стер часть нити.
Толку с таких "тов. майор".
А ты звание офицерское на какой такой законной основе себе присвоил? За такие обороты в Росии есть статейка КОАП как минимум. Ряженый ты наш.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #44

84. Сообщение от Аноним (85), 08-Ноя-21, 13:50   +/
>Мне больше нравится то, что даже для Linux пакет оформлен в rar-архив.

Так это говорит о целевой аудитории использующих.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

85. Сообщение от Аноним (85), 08-Ноя-21, 13:54   +1 +/
Не на Rust, значит, нет.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #60

86. Сообщение от Аноним (85), 08-Ноя-21, 13:59   +/
Майор Шевчук, Вы?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #54

87. Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 14:03   +/
> Повторяюще, при каждом измерении, контакт питания в USB коннекторе показывает 5 Вольт,
> потому и называется источником постоянного тока. :)

результат измерения ведь один и тот же, повторяется. Можно представить генератор который именно вам при измерении будет показывать одно и тоже повторяющееся значение, это же нельзя назвать постоянным генератором.

> У меня не разу не возникал.

хмм

>> по факту у вас только один экземпляр текста получается, и не
>> факт, что дважды написанный текст написан одним человеком.
> Так для частотного анализа одного сообщения маловато.

ну вот, а копипаста и вопрос который должен возникнуть как раз об этом говорит, что у вас одно сообщение, которое равнозначно 10-ти копипастам. Но как быть, если это копипаста разных людей? мы  же не можем сказать, раз 10 копипаст, то это точно один человек флудит.


Ответить | Правка | Наверх | Cообщить модератору
Родитель: #80 Ответы: #89

89. Сообщение от n00by (ok), 08-Ноя-21, 14:27   +/
>> Повторяюще, при каждом измерении, контакт питания в USB коннекторе показывает 5 Вольт,
>> потому и называется источником постоянного тока. :)
> результат измерения ведь один и тот же, повторяется. Можно представить генератор который
> именно вам при измерении будет показывать одно и тоже повторяющееся значение,
> это же нельзя назвать постоянным генератором.

Не нужно представлять какой-то генератор. "Постоянно" написал Аноним в №69. В его терминологии ему я и ответил.

Применительно к авторству текстов. Некоторые утверждают, якобы n00by постоянно пишет про Rosa Tresh. Если бы они были правы, то в каждом моём сообщении встречались бы эти слова. Частота их появления (в сообщениях) совпадала бы с частотой публикации сообщений.

>> У меня не разу не возникал.
> хмм
>>> по факту у вас только один экземпляр текста получается, и не
>>> факт, что дважды написанный текст написан одним человеком.
>> Так для частотного анализа одного сообщения маловато.
> ну вот, а копипаста и вопрос который должен возникнуть как раз об
> этом говорит, что у вас одно сообщение, которое равнозначно 10-ти копипастам.
> Но как быть, если это копипаста разных людей? мы  же
> не можем сказать, раз 10 копипаст, то это точно один человек
> флудит.

Частотный анализ устанавливает авторство текста, в том числе когда выдают чужой текст за свой. Считают частоты появления слов в образцах, после чего сравнивают с иными текстами. При копипасте наблюдается дословное совпадение с эталоном. Зачем там частотный анализ?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #87 Ответы: #90

90. Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 15:09   +/
> Не нужно представлять какой-то генератор. "Постоянно" написал Аноним в №69. В его
> терминологии ему я и ответил.

ок

> Если бы они были правы, то в каждом моём сообщении встречались бы эти слова.

да это и есть постоянство (константность), и анализ выявляет не частотность (от слова изменчивость), а постоянство (константность).


> Считают частоты появления слов в образцах, после чего сравнивают
> с иными текстами.

тогда иные текста должны быть эталоном, а если этого нет - то и авторство не выявить.

> При копипасте наблюдается дословное совпадение с эталоном.

эталоном конкрентного автора, а не копипастера. И в данном случае нельзя отличить копипастера от автора.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #89 Ответы: #91

91. Сообщение от n00by (ok), 08-Ноя-21, 15:55   +/
>> Не нужно представлять какой-то генератор. "Постоянно" написал Аноним в №69. В его
>> терминологии ему я и ответил.
> ок
>> Если бы они были правы, то в каждом моём сообщении встречались бы эти слова.
> да это и есть постоянство (константность), и анализ выявляет не частотность (от
> слова изменчивость), а постоянство (константность).

Частотный анализ - это от шифра Цезаря. Римляне придумали (условно) заменять букву О на Р, А на М и так далее. Потом оказалось, что буква О в языке встречается наиболее часто, на этом основании Р расшифровали как О. При этом частоты появления букв (на 1000 символов) в разных языках различаются, соответственно можно судить о языке оригинала. Можно определять принадлежность текста другим группам. Если часто встречается слово "GPL", наверняка автор текста принадлежит к условной группе "любители Линукс". И так далее конкретизируется вплоть до индивида.

>> Считают частоты появления слов в образцах, после чего сравнивают
>> с иными текстами.
> тогда иные текста должны быть эталоном, а если этого нет - то
> и авторство не выявить.

Автор ветки озвучил задачу. Есть известные аккаунты (а значит и образцы текста). Надо найти неизвестные. Если кто-то публикует копи-пасту (репост) -- это может оказаться пригодным решением, хотя бы отчасти.

>> При копипасте наблюдается дословное совпадение с эталоном.
> эталоном конкрентного автора, а не копипастера. И в данном случае нельзя отличить
> копипастера от автора.

А оно надо?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #90 Ответы: #99

92. Сообщение от Аноним (92), 08-Ноя-21, 16:11   +1 +/
> 7z шляпа поконченная, теряет почти все метаданные. Плохой формат. Тар сохраняет всё без потерь

Расширить формат любыми метаданными - вопрос конвенции. Либо служебными полями в архиве (наверняка он предусматривает такую возможность) либо на крайняк текстовым файлом со специальным именем как на Маках сделано (раздражает, конечно, но уж лучше так).

> Lrzip кстати эффективнее 7z жмёт, потому что он дедуплицирует одинаковые данные в тарболе

Мне пофиг как он жмёт. Я хочу иметь возможность прочитать оглавление архива не расжимая весь архив.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #56 Ответы: #93, #103

93. Сообщение от Аноним (56), 08-Ноя-21, 16:25   +/
Для этого нужен всего лишь небольшой твик, например можно отдельно индекс сохранять. Заодно и извлекать произвольные файлы из тарбола не читая всё можно. Если это никем не используется в дикой природе, видимо, не особо и востребовано. Но ты всегда можешь сделать для себя. А вот 7z ничто не поможет.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #92

94. Сообщение от Аноним (94), 08-Ноя-21, 16:41   +/
А что будет если себя поискать?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #113

95. Сообщение от макпыф (ok), 08-Ноя-21, 17:33   +/
ну так смотреть не только по ФИО можно, но и по нику. А использование одинакового ника в разных местах - частое явление
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10

96. Сообщение от pofigist (?), 08-Ноя-21, 20:32   +/
> 50000 редакторов кода и фотошопов?

Вот редакторов кода - с лёгкостью! Их пишут все кому не лень, это как биллинг и мониторинг. 🤣

Но вся засада в том что этими двумя классами программ - профессиональный софт не ограничивается... Я боюсь что только типов профсофта - с лёгкостью наберётся на 50к. И для каждого типа - несколько вариантов решения...

Только одна контора типа Роснефти - сопровождает несколько тысяч самописных приложений для внутреннего использования. А у РЖД или Сбера - счёт таких приложений идёт на десятки тысяч. И это - чисто решения для внутреннего пользования. И таки да - мы знаем в какую СУБД упирается их значительная часть 😀 Но это просто к слову пришлось.

А вот из софта, присутствующего на рынке - CAD-системы. Они вовсе не закончиваются на автокаде, одних их - наберётся не одна сотня...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #62 Ответы: #107

97. Сообщение от псевдонимус (?), 08-Ноя-21, 20:41   +/
> Допустим, если человек часто использует редко встречаемые или устаревшие слова, это определённо
> аномалия. Если он постоянно любит поднимать какую-либо тему, или известный ему
> пример. Необходимо анализировать всё в совокупности, нельзя получить сколько-нибудь правдоподобный
> результат полагаясь на один метод. И, по-моему, насчёт текстов Брежнева, никакой
> определённости до сих пор нет.

Все проще: достаточно взглянуть на текст, чтобы понять, что это именно этот аноним.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #69 Ответы: #100, #117

98. Сообщение от псевдонимус (?), 08-Ноя-21, 20:43   +/
> Некоторых можно идентифицировать по глупым вопросам.

Для хаброчеловека глупые вопросы это нормально. Ты отвечал одному из них.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #76

99. Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 21:26   +/
> Частотный анализ - это от шифра Цезаря. Римляне придумали (условно) заменять букву
> О на Р, А на М и так далее.

нет, это простая замена, и анализ не на основе шифрованного текста проводится, проводится анализ открытых текстов,и из-за того, что шифрованный текст (в случае с банальной заменой) сохраняет все статистические (частотные) свойства открытого текста, то применяя статистические данные открытых текстов можно спокойно расшифровывать шифрованные данные методом предположений (именно предположений).

> Потом оказалось,
> что буква О в языке встречается наиболее часто, на этом основании
> Р расшифровали как О.

когда потом? это и есть результат частотного анализа открытых текстов.

> При этом частоты появления букв (на 1000
> символов) в разных языках различаются, соответственно можно судить о языке оригинала.

в этом случае необходимо иметь все частотные характеристики, и они 100% точности не дадут.  Тут уже не только статистика вхождений букв в тексте, но и зависимость от ее позиции необходима.

> Можно определять принадлежность текста другим группам. Если часто встречается слово "GPL",
> наверняка автор текста принадлежит к условной группе "любители Линукс". И так
> далее конкретизируется вплоть до индивида.

до индивида не конкретизируете, ибо такое сообщение должно быть написано кровью автора с сохранением днк :)


> Автор ветки озвучил задачу. Есть известные аккаунты (а значит и образцы текста).

А что доказано авторство тех самых аккаунтов? Речь идет о тех кто пишет допустим под ником Аноним, и таких тыща. Вопрос, можно ли доказать вашим анализом принадлежность комента сферическому Васе Пупкину?

> Надо найти неизвестные. Если кто-то публикует копи-пасту (репост) -- это может
> оказаться пригодным решением, хотя бы отчасти.

Не будет это пригодным, это один и тот же текст (избыток).

> А оно надо?

Ну суть вопроса такова, привязать комент к конкретному автору.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #91 Ответы: #108

100. Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 21:28   +/
> Все проще: достаточно взглянуть на текст, чтобы понять, что это именно этот
> аноним.

недостаточно, есть подражатели, что может сбить вас с толку.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #97 Ответы: #109

101. Сообщение от Аноним (101), 08-Ноя-21, 21:56   +/
> 1560. 🇷🇺 Opennet он и вас посчитал...

ЛОР тоже посчитали?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #43 Ответы: #102

102. Сообщение от Аноним (101), 08-Ноя-21, 21:57   +/
> 1265. 🇷🇺  LOR

UPD: А вижу что и ЛОР там тоже есть https://www.opennet.ru/openforum/vsluhforumID3/125791.html#71

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #101

103. Сообщение от Admino (ok), 08-Ноя-21, 23:09   +1 +/
> Расширить формат любыми метаданными - вопрос конвенции.

Вот когда расширят, тогда и поговорим.tar.7z

> Я хочу иметь возможность прочитать оглавление архива не расжимая весь архив.

В смысле, ты хочешь tar tf?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #92

105. Сообщение от Аноним (105), 08-Ноя-21, 23:26   +/
Добавьте в репозиторий Fedora, пожалуйста.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #112

107. Сообщение от n00by (ok), 09-Ноя-21, 10:21   +/
>> 50000 редакторов кода и фотошопов?
> Вот редакторов кода - с лёгкостью! Их пишут все кому не лень,
> это как биллинг и мониторинг. 🤣

С блокнотами не путаете? Я написал музыкальный редактор, но редактор кода не писал. Это как бы немножко побольше работы, чем собственная реализация контрола RichTextEdit. Я даже пару десятков редакторов не могу сходу вспомнить. И я имею ввиду даже не интегрированные среды, а продукты типа Source Insigth.

> Но вся засада в том что этими двумя классами программ - профессиональный
> софт не ограничивается... Я боюсь что только типов профсофта - с
> лёгкостью наберётся на 50к. И для каждого типа - несколько вариантов
> решения...

Это всё предположения. Навроде того, как неустановленные личности запустили 20 тыщ раз утилиту hw-probe в ОС Rosa Tresh, из чего фанаты сделали вывод, что их минимум пол миллиона пользователей.

> Только одна контора типа Роснефти - сопровождает несколько тысяч самописных приложений
> для внутреннего использования. А у РЖД или Сбера - счёт таких
> приложений идёт на десятки тысяч. И это - чисто решения для
> внутреннего пользования.

Во. Внутреннего! Внутри конторы - это опенсорс, а другие его не видят. При этом все компании из Вашего списка - как бы государственные.

> И таки да - мы знаем в какую СУБД
> упирается их значительная часть 😀 Но это просто к слову пришлось.
> А вот из софта, присутствующего на рынке - CAD-системы. Они вовсе не
> закончиваются на автокаде, одних их - наберётся не одна сотня...

Надо набрать 500 тыщ.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #96

108. Сообщение от n00by (ok), 09-Ноя-21, 11:00   +/
>> Частотный анализ - это от шифра Цезаря. Римляне придумали (условно) заменять букву
>> О на Р, А на М и так далее.
> нет, это простая замена, и анализ не на основе шифрованного текста проводится,

Вы с кем спорите и зачем? Я не утверждал, что частоты определяются по шифротексту. Анализ к нему применяется, что бы по совпадению частот установить соответствие символов.

> проводится анализ открытых текстов,и из-за того, что шифрованный текст (в случае
> с банальной заменой) сохраняет все статистические (частотные) свойства открытого текста,
> то применяя статистические данные открытых текстов можно спокойно расшифровывать шифрованные
> данные методом предположений (именно предположений).
>> Потом оказалось,
>> что буква О в языке встречается наиболее часто, на этом основании
>> Р расшифровали как О.
> когда потом? это и есть результат частотного анализа открытых текстов.

Когда проанализировали образец, то есть открытые тексты, очевидно же. =)

>> При этом частоты появления букв (на 1000
>> символов) в разных языках различаются, соответственно можно судить о языке оригинала.
> в этом случае необходимо иметь все частотные характеристики, и они 100% точности
> не дадут.  Тут уже не только статистика вхождений букв в
> тексте, но и зависимость от ее позиции необходима.
>> Можно определять принадлежность текста другим группам. Если часто встречается слово "GPL",
>> наверняка автор текста принадлежит к условной группе "любители Линукс". И так
>> далее конкретизируется вплоть до индивида.
> до индивида не конкретизируете, ибо такое сообщение должно быть написано кровью автора
> с сохранением днк :)

Бросьте эти вангования. Они дают базу для поведенческого анализа.

>> Автор ветки озвучил задачу. Есть известные аккаунты (а значит и образцы текста).
> А что доказано авторство тех самых аккаунтов? Речь идет о тех кто
> пишет допустим под ником Аноним, и таких тыща. Вопрос, можно ли
> доказать вашим анализом принадлежность комента сферическому Васе Пупкину?
>> Надо найти неизвестные. Если кто-то публикует копи-пасту (репост) -- это может
>> оказаться пригодным решением, хотя бы отчасти.
> Не будет это пригодным, это один и тот же текст (избыток).
>> А оно надо?
> Ну суть вопроса такова, привязать комент к конкретному автору.

Суть вопроса досконально понятна автору и он удалился. Но можете попробовать отвечать мне исключительно копипастами какого-то индивида. :)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #99

109. Сообщение от n00by (ok), 09-Ноя-21, 11:11   +1 +/
>> Все проще: достаточно взглянуть на текст, чтобы понять, что это именно этот
>> аноним.
> недостаточно, есть подражатели, что может сбить вас с толку.

Как раз его не собьёт.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #100

110. Сообщение от Составление сообщения (?), 10-Ноя-21, 13:07   +/
Почему?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #50 Ответы: #111

111. Сообщение от псевдонимус (?), 10-Ноя-21, 13:15   +/
> Почему?

Потому, что солярка тру!


Шутка. Просто практически единственный нормальный юникс остался.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #110

112. Сообщение от псевдонимус (?), 10-Ноя-21, 23:37   +/
> Добавьте в репозиторий Fedora, пожалуйста.

Возьми и опакеть.

Что за линуксоиды пошли..

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #105

113. Сообщение от псевдонимус (?), 10-Ноя-21, 23:38   +/
> А что будет если себя поискать?

Программа написана пердонистами на пердоне. Скорее всего ничего. Попробуй

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #94

114. Сообщение от Аноним (-), 11-Ноя-21, 01:03   +/
Фух, теперь можно смело песадь все что думаю, уже есть кому отвечать.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #42

115. Сообщение от Аноним (-), 11-Ноя-21, 01:04   +/
какбы почти всем
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #30

116. Сообщение от Аноним (-), 11-Ноя-21, 01:05   +/
А ты зачем свою рожу в инторнет выложил то дубина ?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #43

117. Сообщение от Аноним (-), 11-Ноя-21, 01:11   +/
"Тот самый аноним" пишет под своим уникальным ником. У правильный анонов даже юсерагенты одинаковы.

Mozilla/5.0 (Windows NT 10.0; rv:68.0) Gecko/20100101 Firefox/68.0

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #97 Ответы: #118

118. Сообщение от псевдонимус (?), 11-Ноя-21, 02:15   +/
> "Тот самый аноним" пишет под своим уникальным ником. У правильный анонов даже
> юсерагенты одинаковы.
>  Mozilla/5.0 (Windows NT 10.0; rv:68.0) Gecko/20100101 Firefox/68.0

Ну и что. Под моим ником пишут по крайней мере 2 человека.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #117


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру