Хотите всегда оставаться в курсе событий? Подписывайтесь на @cryptochan и получайте новости в нашем Telegram канале.
×
Главная » #STREAM » Новости криптовалют за 29.09.2021
08:38

Что такое нейронная сеть?

Что такое набор данных? Набор данных или датасет — это коллекция однотипных данных, необходимых для обучения нейросетей. Например, чтобы натренировать алгоритм распознавания человеческих лиц, ему необходимо показать большое количество фотографий других людей. Чем больше данных — тем точнее алгоритм. Датасеты бывают трех видов: тренировочный (training dataset) — используется при обучении нейросети;тестовый (test dataset) — необходим для проверки точности обучения;валидационный (validation dataset) — независимый набор данных, использующийся для финальной оценки точности алгоритма. Данные могут быть любого формата: таблицы, фото, видео, аудио и прочее. При использовании методов обучения с учителем, зачастую данные размечают с помощью специализированного ПО. Однако из-за неточностей в датасетах конечные модели могут содержать ошибки. Например, в апреле 2021 года специалисты Массачусетского технологического института выяснили, что популярные датасеты содержат множество ошибок. Так, в популярных наборах данных для тестовых проверок точности алгоритмов содержатся изображения, на которых гриб может быть подписан как ложка, лягушка — кошкой, а высокая нота Арианы Гранде в аудиофайле отмечена как свист. Другое исследование MIT показало, что безответственность работников краудсорсингового маркетплейса Amazon Mechanical Turk препятствуют развитию систем генерации текстов. Дело в том, что им платят за единицу размеченной информации. Как правило, такие работники стараются работать быстро и не особо вникая в достоверность разметки. Чтобы не допустить такого, исследователи призывают разработчиков соблюдать «гигиену» данных. При обучении с подкреплением, данные в разметке не нуждаются, так как агент в среде должен самостоятельно отыскать закономерности и получить вознаграждение при достижении цели.

Обсудить в чате
Похожие новости
  • 11 Окт, 01:19

    Что такое NFT, или почему люди платят миллионы долларов за "воздух"

    Цифровые технологии охватывают различные сферы деятельности человека. Помимо электронных денег в виде криптовалюты, люди стали тратить миллионы долларов на покупку виртуальных культурных ценностей. Подробнее в материале Нурфин.

  • 10 Окт, 06:03

    Сергей Обухов: Что такое Московская платформа ДЭГ? Версии и первые итоги судебных тяжб

    Обухов Сергей Павлович Член Президиума, секретарь ЦК КПРФ, д.полит.наук ОбуховСергейПавлович Член Президиума, секретарь ЦК КПРФ, д.полит.наук Персональная страница На сегодняшний день результаты выборов по электронному голосованию оспариваются в Моск...

  • 7 Окт, 13:40

    Что такое кроссчейн-мосты?

    Почему кроссчейн-мосты сложно реализовать? Операция обмена между пользователями, один из которых хочет купить актив А, а другой продать его за актив Б, при отсутствии доверия между ними требует наличия третьей стороны (гаранта). Гарант получит актив ...

  • 28 Сен, 06:02

    Что такое Lightning Network

    Блокчейн Биткойна может обрабатывать в среднем только 7 транзакций в секунду. Этого, конечно, недостаточно, чтобы сделать его подходящей платформой для обработки миллионов транзакций, которые люди совершают каждый день. Таким образом, чтобы Биткойн м...

  • 22 Сен, 19:57

    Что такое токен. Объясняем простыми словами

    «Что такое продуктовый токен и ICO, лучше всего объяснил Константин Виноградов из Runa Capital. Он приводит такой пример: представьте, что мы строим новый метрополитен. Мы заранее выпускаем жетоны для этого метрополитена, токены, и говорим: вы заплат...

В мире за неделю

Pro banner