The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Yahoo опубликовал крупнейшую базу данных для систем машинного обучения

14.01.2016 23:54

Компания Yahoo разместила в публичном доступе крупнейший набор данных для исследователей машинного обучения и искусственного интеллекта, включающий информацию о 110 миллиардах событий (размер БД 13.5 Тб). База содержит обезличенные данные, накопленные с февраля по май 2015 года и включающие сведения о поведении 20 млн пользователей при чтении новостей на сайтах Yahoo.

Информация о взаимодействии с сайтами Yahoo включает сведения о прочитанных статьях в привязке к обезличенным пользователям, для которых приводятся демографические данные (пол, возраст, местоположение), что позволяет сформировать портрет интересов каждого пользователя и выработать индивидуальные рекомендации. Исследователи могут использовать БД для проверки рекомендательных систем, при разработке методов совместной фильтрации, контексто-зависимых систем обучения, крупномасштабных алгоритмов машинного обучения, моделирования поведения пользователей, систем повышения качества контента и автономных методов обучения.

  1. Главная ссылка к новости (http://yahoolabs.tumblr.com/po...)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/43674-ai
Ключевые слова: ai, yahoo
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (37) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, A.Stahl (ok), 00:07, 15/01/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • –12 +/
    >и включающие сведения о поведении 20 млн пользователей при чтении новостей на сайтах Yahoo.

    Например? Прочитал-закрыл-окно? И так 20 млн раз? Какая там информация и как она вообще может помочь при обучении чего-либо?
    Короче, Yahoo  в очередной раз попыталась напомнить, что она ещё существует. Артефакт из 90х...

     
     
  • 2.2, nazarpc (?), 00:18, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +9 +/
    А перейти посмотреть по ссылке религия не позволяет?
     
     
  • 3.3, A.Stahl (ok), 00:21, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • –13 +/
    Религия? Нет, брезгливость. Ковыряться в остатках вещей полусдохшего бомжа? Вот ещё...
     
     
  • 4.8, Аноним (-), 03:56, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Вроде бы, на Западе это всё ещё второй медиапортал-поисковая система после гугла (ну может третий, после бинга) и вполне живёт.
     
  • 4.11, имя (?), 08:28, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +12 +/
    не нужно называть тупость брезгливостью, пожалуйста.
     
  • 2.7, Аноним (-), 02:55, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Может это просто вам не нужно?
     
  • 2.12, Аноним (-), 09:04, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Вы бы полегче в комментариях, а то, не ровен час, руководство Yahoo их прочитает, потеряет вконец веру в будущее и объявит себя банкротом. Тысячи сотрудников Yahoo останутся без работы. Как вы после этого будете смотреть в глаза своим детям?
     
     
  • 3.26, Аноним (-), 14:16, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Это произойдет точно не по его вине
     
     
  • 4.34, РОСКОМУЗОР (?), 16:58, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    По его вине вобще ничего не произойдёт.
     
  • 3.36, XoRe (ok), 20:05, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > Как вы после этого будете смотреть в глаза своим детям?

    Нет детей - некуда смотреть - нет проблем.
    Вперед, анонимус, разрушь Яху!

     

  • 1.13, Аноним (-), 09:30, 15/01/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    >Короче, Yahoo  в очередной раз попыталась напомнить, что она ещё существует. Артефакт из 90х...

    Но при этом имеет в 2 раза больше сотрудников (11 000 в 2015 против 5 600) и в 14 раз большую прибыль чем Яндекс.

     
     
  • 2.14, A.Stahl (ok), 10:12, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • –7 +/
    >чем Яндекс

    Яндекс? Слышал, но не помню чтобы пользовался их сервисами хоть раз за последние лет 5. Для меня они ничем не отличаются от Yahoo.

     
     
  • 3.16, Тот_Самый_Анонимус (?), 10:33, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +4 +/
    >Для меня они ничем не отличаются от Yahoo.

    Ты считаешь себя идеалом? Или своё мнение чего-то стОящим? Чего сказать-то своим выхлопом хотел?

     
     
  • 4.18, A.Stahl (ok), 10:52, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Для меня моё мнение, когда оно основывается на объективных факторах, важнее мнения любого другого человека. Если ты пользуешься сервисами Яху или Яндекса, то это лишь твоё дело и я тебя не осуждаю. Мне нет до этого дела. Но с моей точки зрения эти компании равноценно бесполезны.
     
     
  • 5.19, Аноним (-), 11:20, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Хорошо наверное жить в вымышленном мире, в котором всё всегда просто и понятно. Вот только приходится избегать столкновений с реальностью, иначе и свихнуться можно.
     
  • 5.20, Тот_Самый_Анонимус (?), 12:12, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >Для меня моё мнение, когда оно основывается на объективных факторах, важнее мнения любого другого человека.

    «А судьи кто?». С чего это твоё мнение объективно? С пропаганды гугла?

    >Но с моей точки зрения эти компании равноценно бесполезны.

    Какова польза от твоей точки зрения и её освещения на данном ресурсе?

     
     
  • 6.22, A.Stahl (ok), 12:58, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >С чего это твоё мнение объективно?

    Я не сказал, что моё мнение объективно. Я сказал, что моё мнение основывается на объективных факторах. А именно: я использую сервисы Яндекса и Яху одинаково редко. Это объективная информация. И согласно этой информации я делаю для себя вывод -- эти сервисы для меня одинаково бесполезны.
    Ты видишь где-то логическую ошибку?
    >Какова польза от твоей точки зрения и её освещения на данном ресурсе?

    Не знаю. Я хочу озвучить свою точку зрения, я могу это сделать и я это делаю.

     
     
  • 7.28, тоже Аноним (ok), 14:55, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > Ты видишь где-то логическую ошибку?

    Я вижу: в ни на чем не основанном допущении, что ваше мнение кого-то интересует.
    Особенно в форме вброса на форуме.

     
  • 7.30, Тот_Самый_Анонимус (?), 15:32, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    >Я не сказал, что моё мнение объективно. Я сказал, что моё мнение основывается на объективных факторах. А именно: я использую сервисы Яндекса и Яху одинаково редко. Это объективная информация. И согласно этой информации я делаю для себя вывод -- эти сервисы для меня одинаково бесполезны.

    Из всего потока мысли вывод один: ты не пользуешься сервисами поисковых систем Яндекс и Яху. Всё. Смею предположить что скорее всего ты пользуешься гуглом, сервисами которого не все пользуются (я, к примеру). Однако к чему весь этот смысловой хлам? Прочитай на что ты отвечал, и как это соотносится с тем, на что ты отвечал.

    >Не знаю. Я хочу озвучить свою точку зрения, я могу это сделать и я это делаю.

    КПД выхлопа 0%. Яндексом и Яху пользуется много людей. Тех же, для кого твоё мнение будет полезным, едва ли десяток наберётся.

     
  • 2.15, anonymous (??), 10:23, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +4 +/
    А магазин в центре города имеет намного больше прибыли, чем на окраине, и что?
     
     
  • 3.17, Клыкастый (ok), 10:48, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +2 +/
    а вот это было обидно...
     
  • 3.41, Вареник (?), 22:38, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Вот, собственно, и все.
     
  • 2.21, Andrey Mitrofanov (?), 12:32, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >>Короче, Yahoo  в очередной раз попыталась напомнить, что она ещё существует. Артефакт из 90х...
    > Но при этом имеет в 2 раза больше сотрудников  (11 000
    > в 2015 против 5 600) и в 14 раз большую прибыль
    > чем Яндекс.

    А мне https://duckduckgo.com/ больше http://dontbubble.us/ нравится, он "has 21 employees". Размер его прибыли... ммм... не знаю.

    Меня интересует, какой результат вы хотите получить или подразумеваете под сей линейко-методой?

     

  • 1.23, DmA (??), 13:03, 15/01/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Неплохо было бы выложить куда-нибудь базы обезличенные базы сбербанка, сколько денег получил пользователь в таком банкомате, такими-то купюрами c такими-то номерами и потом оставил эти купюры там-то, какими купюрами платит за телефон,Интернет, какими хлеб в магазине покупает и тд .Наверно можно было вычислить по  номерам денежных  купюр увидеть где оставляет их человек и где собирает, где бывает  тот или иной человек и почти всё узнать о его образе жизни, доходах встречах с кем-то итд
     
     
  • 2.24, Michael Shigorin (ok), 13:41, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > такими-то купюрами c такими-то номерами и потом оставил эти купюры там-то

    Был проект отслеживания перемещений наличных по замеченным номерам, в том числе получивший довольно интересные результаты (фиксируют факт оплаты товара/услуги в месте во время).

    Боюсь, других ключевых слов не припомню, но если интересно, то может хватить и этих.

     
     
  • 3.37, nonymous (?), 20:37, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    >> такими-то купюрами c такими-то номерами и потом оставил эти купюры там-то
    > Был проект отслеживания перемещений наличных по замеченным номерам, в том числе получивший
    > довольно интересные результаты (фиксируют факт оплаты товара/услуги в месте во время).
    > Боюсь, других ключевых слов не припомню, но если интересно, то может хватить
    > и этих.

    'Where's George'?

     
  • 2.25, Forth (ok), 13:48, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Сначала придется обязать каждого гастарбайтера в каждом ларьке все номера купюр переписывать, хотя бы когда он их получил и за какой товар.
     
     
  • 3.32, DmA (??), 16:26, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    ларьков уж почти нигде не осталось, супермаркеты проллобировали разные законы, чтобы их всех мелких продавцов задавить
     
  • 2.27, Аноним (-), 14:19, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Наличку не отследить, автоматизированно такое можно провернуть разве что с биткоином, и то при добровольном согласии участников
     
  • 2.29, тоже Аноним (ok), 15:03, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > и почти всё узнать о его образе жизни

    Если у вас весь образ жизни связан с купюрами - можно только посочувствовать ;)
    Да и в системе погрешностей очень много. Я, например, хожу в бассейн, но не плачу за него, поскольку работодатель выкупил для сотрудников дорожку. Ну, и на работу хожу отнюдь не затем, чтобы расстаться с деньгами...

     
     
  • 3.33, DmA (??), 16:39, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >> и почти всё узнать о его образе жизни
    > Если у вас весь образ жизни связан с купюрами - можно только
    > посочувствовать ;)
    > Да и в системе погрешностей очень много. Я, например, хожу в бассейн,
    > но не плачу за него, поскольку работодатель выкупил для сотрудников дорожку.
    > Ну, и на работу хожу отнюдь не затем, чтобы расстаться с
    > деньгами...

    но пока добираетесь до работы  платите за бензин или за за проезд в общественном транспорте, а если ещё и камеры по городу расставить(что уже почти везде сделано), а также на въезде и выезде из города, то видно много чего. В прошлом феврале Немцова убили, так машину его предполагаемых убийц отследили и установили,что за Немцовым они следят аж с сентября 2014 года(то есть уже полгода как). Номера машин привязаны к паспорту, всякие акции в магазинах и заправках тоже стараются привязать к  конкретной фамилии, а если ещё добавить данные  от слежки сотовых компаний,  и эти пути продвижения некоторых телефонов проанализировать,а ещё проанализировать кто и кому звонил(не обязательно прослушивать телефоны), то можно легко будет найти например все пары любовниц и любовников :). Построить графы всех близких  и деловых отношений между людьми,увидеть кто и когда приходит на работу и когда уходит:). А ещё можно добавить трафик интернет компаний и посмотреть кто и куда ходил :( То тут можно не только образ жизни человека воссоздать, но и скорей всего угадать его мысли, познания,уровень невежества, интересы и тд

     
     
  • 4.35, тоже Аноним (ok), 17:12, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > пока добираетесь до работы  платите за бензин или за за проезд в общественном транспорте

    Во-первых, нет ;)
    Во-вторых, у нас проезд пока не требуется купюрами оплачивать, а мелочь вы не отследите никогда
    Наконец, даже купюры, которые вы принесли в магазин, совершенно спокойно уходят оттуда через полчаса в чьем попало кармане в виде сдачи, например. Или вы предполагаете на каждой кассе контроль в реальном времени устроить?
    Ну, и камеры далеко не повсюду, не говоря уже о том, что есть и другие города...
    В общем, нереально это - устроить за всеми такую же слежку, которую кое-как еще можно устроить за одним подозреваемым.

     
     
  • 5.38, nonymous (?), 20:39, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • –1 +/
    >[оверквотинг удален]
    > Во-первых, нет ;)
    > Во-вторых, у нас проезд пока не требуется купюрами оплачивать, а мелочь вы
    > не отследите никогда
    > Наконец, даже купюры, которые вы принесли в магазин, совершенно спокойно уходят оттуда
    > через полчаса в чьем попало кармане в виде сдачи, например. Или
    > вы предполагаете на каждой кассе контроль в реальном времени устроить?
    > Ну, и камеры далеко не повсюду, не говоря уже о том, что
    > есть и другие города...
    > В общем, нереально это - устроить за всеми такую же слежку, которую
    > кое-как еще можно устроить за одним подозреваемым.

    *Пока* нереально.

     
     
  • 6.40, Аноним (-), 22:25, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    >[оверквотинг удален]
    >> Во-вторых, у нас проезд пока не требуется купюрами оплачивать, а мелочь вы
    >> не отследите никогда
    >> Наконец, даже купюры, которые вы принесли в магазин, совершенно спокойно уходят оттуда
    >> через полчаса в чьем попало кармане в виде сдачи, например. Или
    >> вы предполагаете на каждой кассе контроль в реальном времени устроить?
    >> Ну, и камеры далеко не повсюду, не говоря уже о том, что
    >> есть и другие города...
    >> В общем, нереально это - устроить за всеми такую же слежку, которую
    >> кое-как еще можно устроить за одним подозреваемым.
    > *Пока* нереально.

    То, что известно лично тебе - не адекватно тому, что существует.

     
  • 5.39, Аноним (-), 22:25, 15/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    >> пока добираетесь до работы  платите за бензин или за за проезд в общественном транспорте
    > Во-первых, нет ;)
    > Во-вторых, у нас проезд пока не требуется купюрами оплачивать, а мелочь вы
    > не отследите никогда
    > Наконец, даже купюры, которые вы принесли в магазин, совершенно спокойно уходят оттуда
    > через полчаса в чьем попало кармане в виде сдачи, например. Или
    > вы предполагаете на каждой кассе контроль в реальном времени устроить?

    Ваша налоговая уже на это замахнулась.

    > Ну, и камеры далеко не повсюду, не говоря уже о том, что
    > есть и другие города...

    А про Биг Дата ты все же почитай.

    > В общем, нереально это - устроить за всеми такую же слежку, которую
    > кое-как еще можно устроить за одним подозреваемым.

    А про Биг Дата ты все же почитай.


     
     
  • 6.42, тоже Аноним (ok), 01:47, 16/01/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > А про Биг Дата ты все же почитай.

    "Я знаю карате, кун-фу и много других страшных слов!!!"
    Могу в ответ посоветовать прочитать про демона второго рода - это ближе к реальности будет.

     

  • 1.43, Аноним (-), 17:08, 20/01/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > ведения о поведении 20 млн пользователей при чтении новостей на сайтах Yahoo
    > что позволяет сформировать портрет интересов каждого пользователя

    Это для уёб-маркетинга. Нас это не касается.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру