The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Команда из Университета Миннесоты раскрыла детали об отправл..."
Отправлено Ordu, 01-Май-21 11:15 
>> Если непонятно, то иди дворы подметать.
> В чем связь?  Кстати, дело полезное - сам Ильич занимался.  У тебя какие-то комплексы против труда?

При чём здесь комплексы? Каждый должен заниматься тем, что у него лучше всего получается. Всем от этого будет лучше.

> Нет, можно попытаться перелопатить рассылку в поисках неизвестно чего, как предлагал ты.  Просто это гораздо сложнее.

А кто-то обещал, что будет просто? Наука -- это в принципе перелопачивание мегатонн данных, в результате которых ты доказываешь утверждение, про которое тебе ещё доказывать придётся, что оно несёт в себе больше 0 бит полезной информации. Скажи спасибо, что здесь не надо для получения каждой точки данных, встречаться лично с автором патча и ревьюером, и интервьюировать каждого по полчаса.

Но то что они сделали -- это просто пустое место. Если, допустим, аппеляция к гомофобии повышает вероятность принятия бага с 0.05, до 0.15, то как ты думаешь, сколько надо заслать багов, чтобы эту разницу замерять хотя бы в стиле "разница есть/нет"? Я не считал, но предположу, что несколько десятков, не меньше двух. Если разница, которую хочется измерить -- это разница между 0.05 и 0.50, то по моим самым оптимистичным оценкам потребуется пяток багов без аппеляции к гомофобии, и ещё пяток с аппеляцией.

> Может ты имел в виду посоветовать аспиранту создать сильный AI, который ему PhD напишет?

AI... не AI... Если написать такой AI, то этот AI будет достаточным поводом для PhD, а может и не для одного, а нескольких.

Но ежели прицел пониже брать, то нужно заняться автоматизацией, а не AI. Если составить список найденных багов, а потом программно сопоставить каждому багу исходный патч и тред обсуждения/ревью, и патч с фиксом, с сопутстующим обсуждением, то можно просматривать по нескольку багов в час, пытаясь высмотреть паттерны. Высматриваешь паттерны, генерируешь гипотезы. Нагенерировал гипотез, проверил их на ещё непросмотренных данных.

Когда процесс будет отработан в таком виде, можно попытаться подключить NLP (уже почти "AI") и автоматизировать выбор тредов, в которых происходит что-нибудь типа "аппеляции к гомофобии" или типа того.

В принципе, можно и без этого. Я думаю, что если найти сотню-другую внесённых багов, то какую-нибудь гипотезу можно сгенерировать. Причём не только "теоретическую", качественную, но и статистическую, количественную. А затем если найти даже 30 точек данных, можно надеятся на p<0.05. Если гипотеза хорошая нашлась.

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
  Введите код, изображенный на картинке: КОД
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру