Меню Закрыть

Рубрика: Google Books

Гарвард при поддержке Microsoft собрал открытый дата-сет из ~500 000 книг, но Google не дает его опубликовать

В прошлый четверг Гарвардский университет объявил о скорой публикации массивного дата-сета для обучения языковых моделей, в котором было собрано почти полмиллиона оцифрованных книг на различных языках. Все материалы, используемые в дата-сете, уж…