Содействие - исключение из 3-го закона Ньютона.

Амальгама

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Амальгама » Математика и программирование » Лента новостей - Математика и программирование


Лента новостей - Математика и программирование

Сообщений 1 страница 15 из 15

1

Настоящим информирую, что данный топик предназначен лишь для опубликования текстов (заголовков) новостей со ссылками на источник. От комментариев категорическая просьба воздержаться и создавать в необходимых случаях отдельные топики для обсуждения существа сообщений текущей темы.

+1

2

2015-02-26 08:02 CwC - программа, целью которой является увеличение коммуникативных способностей компьютеров до уровня человека Целью новой инициативы Управления перспективных исследовательских программ Пентагона DARPA, известной под названием Communicating with Computers (CwC), является развитие новых алгоритмов программного обеспечения и аппаратных средств вычислительных систем, которые должны поднять коммуникативные способности компьютеров и других машин до уровня человека, что позволит этим компьютерам эффективно общаться с людьми при помощи живого естественного языка. В рамках программы CwC уже был проведен ряд работ и имеются некоторые решения, эффективность которых будет проверяться в ходе двух различных экспериментов, сосредоточенных в области диалогового общения между человеком и компьютером.

0

3

4

Китайские ученые создали программу, определяющую возраст по лицу

0

5

6

Математики радикально ускорили обработку данных криомикроскопии

https://nplus1.ru/images/2015/04/24/d9917d94c24ade8ee0f9da787ed1fdb7.png
Слева направо: структуры белков GroEL-GroES и АТФазы T. thermophilus, использовавшиеся как модельные в работе авторовMarcus A. Brubaker et al./ arXiv

Ученые из Университета Торонто добились значительного улучшения в технике криомикроскопии — многообещающего подхода к расшифровке строения белков. Их результаты обеспечивают статысячекратное увеличение скорости обработки данных. Препринт статьи доступен на сайте arXiv.org, кратко ознакомиться с работой можно в блоге издания MIT Technology Review.

Традиционный подход к изучению строения белков заключается в рентгеновском исследовании их кристаллов. Ученые выращивают монокристаллы белков и изучают, как рассеивается рентгеновское излучение, проходя через них. Самой трудной частью такого метода является получение самих кристаллов — во многих случаях белки попросту не кристаллизуются, а порой их структура в монокристалле значительно отличается от существующей в живом организме.

https://nplus1.ru/images/2015/04/24/444337fd27685afe3d36cc0d120fd537.jpg

Так рассеивается излучение от кристалла протеазы коронавируса, вызывающего тяжелый острый респираторный синдром (атипичную пневмонию)Wikimedia Commons

В связи с этим ученые ищут альтернативные методы получения трехмерных структур белков. Одним из них является просвечивающая электронная криомикроскопия. В этом методе раствор белка в воде очень быстро замораживается — достаточно быстро, чтобы не успели образоваться кристаллики льда, способные нарушить естественную геометрию молекулы. Получается очень тонкая пластинка, содержащая огромное количество молекул, повернутых под разными углами к наблюдателю. Ее исследуют в просвечивающем электронном микроскопе, получая сотни тысяч изображений — «теней» молекул.

Компьютерными методами ученые складывают двухмерные изображения в одно трехмерное, получая тем самым структуру белка. Главным минусом данной методики долгое время было низкое разрешение и большое время, требующееся для получения структуры - на 300 ядрах суперкомпьютера расчет библиотеки из 200 тысяч «теней» занимает порядка двух недель.

https://nplus1.ru/images/2015/04/24/af2e47ba5513ccf848ed7177f4e4495a.png
Процесс восстановления структуры белка методом криомикроскопии. Слева направо: «тени» молекул, получаемые структуры, срезы структур и распределение плотности в нихMarcus A. Brubaker et al./ arXiv.org, 2015

Авторы новой работы предложили ряд усовершенствований, позволивших значительно ускорить процесс восстановления структуры белков и увеличить их точность. Во-первых, используя алгоритмы машинного обучения, исследователи провели предварительную обработку изображений «теней», позволившую убрать большое количество шумов, содержащихся в них. Это сократило объем информации, который обрабатывается компьютером, однако наибольший прирост в скорости обработки информации привнесло другое нововведение.

Ученые включили в алгоритм, накладывающий «тени» друг на друга, предположение о том, что большинство молекул в слое лежат «на боку». Это позволило уменьшить в разы количество вариантов наложений, рассматриваемых компьютером. Два этих усовершенствования, по словам авторов, увеличили скорость обработки данных в сотни тысяч раз. Для сравнения, теперь вычисление строения белка занимает всего сутки на современной рабочей станции.

https://nplus1.ru/images/2015/04/24/781597a4d978ab33ecf0827a005db481.png
Эволюция разрешения структуры АТФ-синтазы T. thermophilus со временем вычисленияMarcus A. Brubaker et al./ arXiv.org, 2015

Сам процесс вычисления итеративен, то есть улучшение разрешения структуры идет постепенно. На примере АТФ-синтазы термофильной бактерии Thermus thermophilus, авторы показали, что грубая оценка структуры белка может быть получена уже за час работы программы.

0

7

Нейросеть научили определять пьяных по лбу

Греческие ученые научились определять пьяных людей по инфракрасному изображению. Исследование опубликовано в Forensic Science International.

Исследователи из Университета Патры обучали нейросети на примере 41 человека, сравнивая инфракрасное изображение лиц испытуемых до и после употребления 480 миллилитров вина. При этом разные нейросети анализировали разные участки лица.

Ученые использовали два подхода. В первом случае изображение разбивалось на небольшие сегменты, которые анализировались по отдельности. Во втором случае алгоритм обрабатывал изображение целиком. Выяснилось, что нейросеть точнее всего определяет пьяного человека по температуре лба и носа. При анализе только этих зон нейросеть определяет употребившего алкоголь человека с точностью выше 90 процентов даже при отсутствии термограммы лица в трезвом состоянии, в то время как при анализе лица целиком точность снижается до 75 процентов.

Предполагается, что исследование может помочь полиции выявлять потенциальных нарушителей общественного порядка при помощи инфракрасных камер. Алгоритм также может лечь в основу систем предупреждения вождения в состоянии алкогольного опьянения.

0

8

Голосовой переводчик Skype открыли для свободной загрузки

Microsoft открыла доступ к версии Skype, которая способна «на лету» переводить речь собеседника. Skype Translator доступен для загрузки в Windows Store.

Skype Translator понимает восемь языков на слух и 45 языков в письменном виде и способен переводить беседу в реальном времени. Программа умеет анализировать контекст, поэтому качество перевода будет выше для длинных предложений. Автоматическое определение языка не поддерживается, для активации функции необходимо выбрать язык, на котором будет говорить ваш собеседник. Вся беседа с оригинальным текстом и переводом будет продублирована в текстовом виде в чат.

Переводчик работает под ОС семейства Windows начиная с версии 8.1, закрытое тестирование Skype Translator началось в декабре 2014, тогда переводчик поддерживал только английский и испанский языки.

0

9

Программа научилась классифицировать живопись по стилям и авторам

Ученые из Ратгерского университета в Нью-Джерси, США, обучили нейронную сеть для распознавания картин по жанрам, стилям и художникам. Их программа с точностью 60% определяла автора картины, с такой же точностью — жанр. Точность определения стиля оказалась гораздо меньше — чуть больше 30%, но это авторы объясняют малым размером выборки, в которой для некоторых стилей нашлось лишь не более 20 примеров. Препринт новой работы выложен на сайте arxiv.org.

В качестве базы данных авторы использовали подборку «Wikiart paintings», которая находится в открытом доступе. В нее включено около 80 тысяч картин более тысячи живописцев. Для каждой картины также доступна информация о ее стиле (импрессионизм, барокко, кубизм и так далее) и жанре (пейзаж, портрет, натюрморт и подобные).

Для обучения нейронной сети ученые использовали несколько алгоритмов, для которых они сравнивали точность и производительность. Все алгоритмы включали несколько основных этапов: выделение вектора «визуальных особенностей» по каждой картине, приведение полученного вектора особенностей к меньшей размерности при помощи той или иной метрики, обучение нейронной сети на части выборки и тестирование на тех картинах, которые не использовались при обучении.

Под «визуальными особенностями» в данном случае имеются ввиду  характерные параметры изображений, которые можно описать численно. Часть из них имеет понятный для человека смысл, например, цветовая гамма картины или характерные форма и направления мазка, однако большинство не «переводятся» на человеческий язык. Для их выделения в работе использовались различные вариации метода главных компонент, который всю доступную цифровую информацию по картине разбивает на кластеры. Из этого разбиения ученые выбирают наиболее информативные параметры, которых в рамках новой работы было от 400 и более.

Все визуальные особенности каждой картины записывались в виде вектора, размерность которого совпадала с числом особенностей. Для того, чтобы использовать эти вектора в задаче классификации, ученые вводили так называемую метрику — способ вычисления «схожести» нескольких векторов между собой. На основании этих метрик программа принимала решение об вероятном авторстве картины, а также о ее принадлежности к тому или иному жанру или стилю.

Не все художники дались программе одинаково легко. Так, например, не удалось эффективно различать картины Клода Моне и Камиля Писсарро. Оба художника были импрессионистами, современниками и даже близкими товарищами, которые оказали друг на друга большое влияние. Аналогичным образом программа часто путала между собой природные и городские пейзажи, так как и там и там обычно используются натуральные цветовые гаммы и часто встречаются природные объекты вроде реки.

Из более очевидных «путаниц» ученые отмечают, например, что программа часто смешивала стили «Ренессанс» и «ранний Ренессанс», «импрессионизм» и «постимпрессионизм», «кубизм» и «синтетический кубизм». Понятно, что эти стили родственны между собой, поэтому зачастую различий между двумя картинами оказывалось недостаточно для их уверенной классификации.

В заключении ученые отмечают, что несмотря на неидеальную точность классификации, их программам удалось побить рекорды предшественников, особенно с учетом того, что в новой работе впервые использована такая большая и разнообразная база. Ранее попытки классификации произведений изобразительного искусства с помощью машинного обучения уже проводились, например в этой работе. Однако тогда речь шла не о определении стилей, а о составлении дерева подобности. Что касается соревнования между машинным обучением и работой экспертов в истории живописи — тут авторы занимают следующую позицию: люди все еще лучше справляются с задачей классификации, но компьютеры уже «наступают им на пятки». В любом случае, эксперты уже могут подчерпнуть много интересных и неизвестных ранее фактов и связей из работы программ-классификаторов.

0

10

Новая Зеландия создаст самого злого в мире робота

В новозеландской компании Touchpoint Group заявили о планах по созданию самого злого робота в мире. По замыслу разработчиков, искусственный интеллект поможет решать сложные конфликтные ситуации с участием разозленных клиентов, к примеру, крупных банков или страховых компаний.

Как пишет The Australian, в разработку злобного робота компания инвестировала полмиллиона американских долларов. Один из крупнейших австралийских банков, а также телекоммуникационные и страховые компании предоставят Touchpoint Group базу данных по сложным ситуациям с клиентами за последние два года.

В течение ближайших шести месяцев данные будут загружены в компьютеры, обработаны, и до конца года исследователи разработают алгоритм действий робота. В итоге он будет имитировать поведение нескольких сотен миллионов разозленных клиентов предприятий для того, чтобы их службы клиентской поддержки тренировались справляться с конфликтами.

Как пояснил исполнительный директор Touchpoint Group Фрэнк ван дер Вельден, искусственный интеллект также будет просчитывать возможное развитие событий: в какой момент спор с клиентом достиг «точки невозврата», а на каком этапе можно избежать скандала.

Устройство неофициально уже получило название «Главный Радиант» – по названию суперкомпьютера, предсказывающего поведение людей на основе анализа данных, «психоистории», из классического романа Айзека Азимова «Основание».

0

11

Windows 10 получит семь версий

Microsoft представила все семь версий новой операционной системы Windows 10, которая будет выпущена летом, сообщается в официальном блоге компании.

Основной версией, рассчитанной на массового потребителя, станет Windows 10 Home. Она будет установлена на большую часть настольных компьютеров и ноутбуков и будет включать в себя все главные функции новой операционной системы, например браузер Microsoft Edge, распознавание лица Windows Hello, виртуальный помощник Cortana.

Модификация Windows 10 Pro ориентирована на малый бизнес и призвана помочь в работе с облачными технологиями и защитой корпоративных данных.

Версия для мобильных устройств Windows Phone будет переименована в Windows 10 Mobile — она предназначена для телефонов, планшетов и Xbox One. Ее особенностью станут фирменные приложения Windows и специальная версия Office, оптимизированная для сенсорных экранов. С помощью специальной опции Continuum for Phone пользователь сможет превращать свой телефон в персональный компьютер при подключении к монитору.

Наряду с этими системами также будут доступны: Windows 10 Enterprise, направленная на средний и крупный бизнес, с более продвинутыми функциями по управлению корпоративными ресурсами; Windows 10 Mobile Enterprise, соответственно, станет вариантом программного обеспечения для ведения бизнеса со смартфона и планшета; Windows 10 Education — вариант операционной системы для сотрудников учебных заведений, преподавателей и самих учащихся; Windows 10 IoT Core, направленная на работу с такими различными устройствами, как банкоматы, платежные терминалы, промышленные роботы и другие.

Операционная система Windows 10 была представлена в сентябре 2014-го. На компьютеры с Windows 7 и Windows 8 новую платформу можно будет установить бесплатно. По заявлению вице-президента по операционным системам Microsoft Терри Майерсона, число устройств, на которые будет установлена Windows 10, превысит один миллиард к 2018 финансовому году.
< Назад в рубрику

0

12

Создатель Mathematica открыл сервис по распознаванию изображений

Стивен Вольфрам открыл доступ к сервису интеллектуального распознавания изображений. Об этом программист пишет в своем блоге.

Функция распознавания ImageIdentify теперь встроена в язык программирования Wolfram и доступна для использования на сайте проекта. Для распознавания нужно просто перетащить или загрузить изображение на сайте сервиса, после чего алгоритм попытается ответить, что изображено на фото. Распознавание производится при помощи анализа самого изображения, а не путем извлечения информации из интренет-страниц, где оно содержится — как, например, в поиске изображений Google. По ответам видно, что алгоритм действительно анализирует изображение и пытается понять по разным признакам — что же изображено на фото.

https://nplus1.ru/images/2015/05/14/1450d1dd45decda7027213eb6beba9f2.png
Примеры ошибочного распознавания образовStephen Wolfram

Система учитывает свои ошибки и корректирует распознавание образов. Таким образом, с помощью машинного обучения ImageIdentify будет с течением времени все лучше распознавать объекты на фото. Стивен Вольфрам уверен, что созданная им функция – важный шаг в развитии систем искусственного интеллекта.

«Ошибки, которые допустает ImageIdentify, выглядят очень по-человечески. Ты видишь ответ и понимаешь, почему программа решила ответить именно так», – объясняет Стивен Вольфрам.

Стивен Вольфрам – британский физик, программист, математик и писатель. Автор вопросно-ответной базы знаний Wolfram|Alpha и системы компьютерной алгебры Mathematica. Вольфрам считает, что созданная им функция распознавания изображений – важный шаг в развитии систем искусственного интеллекта.

Подобная система распознавания изображений на основе машинного обучения без учителя разрабатывалась в лабораториях Google до 2012 года (она стала широко известна как «система распознавания котов»). Впоследствии Эндрю Ын, руководитель  этого направления в компании, ушел из Google. Насколько текущий поиск по изображениям использует созданные им наработки, неизвестно.

0

13

В России решили создать конкурента iOS и Android

14 мая в Минкомсвязи прошла встреча главы ведомства Николая Никифорова с сотрудниками финской компании Jolla и представителями российской IT-индустрии, сообщило в пятницу министерство. На встрече обсуждалось создание в России независимой мобильной операционной системы (ОС), что соответствует планам министерства по импортозамещению.

В России решили создать конкурента iOS и Android
На совещании присутствовали председатель совета директоров Jolla Антти Саарнио, технический директор и главный конструктор компании, а также директор по распространению технологий «Яндекса» Григорий Бакунов и гендиректор разработчика операционных систем «Альт Линукс» Алексей Смирнов.

Новую независимую операционную систему будут разрабатывать российские IТ-специалисты, а основой будущего продукта может стать ОС с открытым исходным кодом Sailfish, которую разрабатывает Jolla (помимо ОС она занимается созданием смартфонов и планшетов), рассказали РБК участники встречи.

Компьютерное импортозамещение
В апреле 2015 года глава Минкомсвязи Николай Никифоров утвердил план по импортозамещению. Согласно документу, мобильные операционные системы относятся к категории программ, для которых нет конкурентоспособных отечественных продуктов: доля импорта в этом сегменте сейчас составляет 95%, но к 2025 году должна сократиться до 50%. Основная задача — решить проблему неприкосновенности личных данных российских пользователей. Около года назад глава Минкомсвязи поднимал этот вопрос на встрече с региональным директором Apple в России Питером Энгробом Нильсеном и генеральным директором SAP в СНГ Вячеславом Ореховым. Никифоров тогда попросил обе компании раскрыть исходные коды своих программ. Представители Apple и SAP не комментировали эту просьбу.

Сделать операционную систему с нуля сложно, поэтому Россия интегрируется в международные проекты, объясняет сотрудничество с Jolla Смирнов из «Альт Линукс». По его словам, для Jolla такое сотрудничество выгодно, так как это даст ОС компании возможность получить широкое распространение. Сейчас на мировом рынке мобильных операционных систем доминируют Android (80,7% проданных в мире устройств, по данным Gartner за 2014 год) и iOS (15,4%).

Операционные системы Windows и BlackBerry OS занимают 2,8 и 0,6% рынка соответственно. На иные ОС, включая Sailfish, приходится лишь 0,5% продаваемых в мире устройств. В России смартфон Jolla на ОС Sailfish можно купить за 20 тыс. руб.

Выходцы из Nokia
Компанию Jolla в 2011 году основали бывшие сотрудники финской Nokia, работавшие в компании над собственной операционной системой Nokia — MeeGo на базе Linux, развитие которой прекратилось после прихода в компанию Стивена Элопа. Компания не раскрывает точную структуру акционеров. В 2013 году 6,25% ее акций за €1 млн купил китайский холдинг China Fortune, в ходе сделки компания была оценена в €16 млн. В 2014 году на краудсорсинговой площадке Indiegogo компания привлекла $1,8 млн за 21 день от более чем 13 тыс. человек, причем $1 млн был собран уже за два дня.

В конце 2014 года Jolla провела еще один раунд привлечения инвестиций — €10 млн. Инвесторов Jolla не раскрывает, известно лишь, что часть средств поступила от европейских инвесторов, часть — от азиатских.

Jolla — международная компания, «в структуре собственников которой помимо финских есть как российские, так и китайские акционеры», приводятся в сообщении Минкомсвязи слова министра Никифорова. Как рассказал РБК источник на рынке, российский акционер Jolla — группа ЕСН Григория Березкина, состояние которого, по оценке журнала Forbes, составляет $0,6 млрд (140-е место в рейтинге богатейших бизнесменов России). Эту информацию РБК подтвердил представитель ЕСН. По его словам, участие в инвестиционном раунде финской компании — один из последних проектов ЕСН. Объем инвестиций и полученную взамен долю компании собеседник РБК раскрыть отказался. Сотрудник Jolla не ответил на запрос РБК.

Группа ЕСН специализируется на энергетических активах. Березкину полностью принадлежат компании «Русэнергоресурс» и «Русэнергосбыт М», а также 51% компании «Русэнергосбыт» и 75% — «Русэнерготелеком». ЕСН владеет инжиниринговыми компаниями «Инженерный центр ЕЭС» и «Энергоаудитконтроль», а также Уярским нефтеналивным терминалом (100%) и терминалом в Сковородино Амурской области (50%). Среди медийных активов группы — газета Metro (владеет франшизой с 2009 года), ИД «Комсомольская правда» (85%) и ИД «РЖД-Партнер» (80%).

По словам представителя ЕСН, за последние два года группа сделала «несколько инвестиций в ряд венчурных проектов». Например, в 2014 году группа ЕСН вложила $5 млн в российского разработчика мобильных платежных систем 2Can совместно с венчурными фондами Almaz Capital и InVenture Partners.

Проект БРИКС
Работать над новой мобильной операционной системой планируется в сотрудничестве со специалистами стран БРИКС, говорится в сообщении Минкомсвязи. «Новую мобильную ОС Sailfish создает финско-российско-китайская компания.

Ожидаем присоединения Индии, Бразилии и ЮАР», — написал в своем Twitter на следующий день после встречи глава Минкомсвязи. Никифоров предложил создать международный консорциум, в который войдут IT-компании России, Бразилии, Индии, Китая и ЮАР. Их сотрудники, к примеру, смогут один день в неделю работать над проектами консорциума, а в остальные дни заниматься основной работой, рассказал РБК представитель Минкомсвязи. «IT-компании дадут своих специалистов, их время будет оплачивать государство, а их работа будет развивать проект», — добавил он.

Вопрос о том, как будет развиваться новая операционная система после ее создания, с представителями IT-компаний не обсуждался, рассказал РБК источник, близкий к участникам встречи. Минкомсвязи хочет сделать новый продукт, а не использовать текущую версию Sailfish, отметил собеседник РБК. Успех ОС будет зависеть от того, понравится ли она конечным пользователям и производителям устройств, подчеркнул он.

Если сотрудничество с Jolla состоится, на российском рынке могут появиться устройства на базе Sailfish, например, YotaPhone, рассчитывает Смирнов. Установить ОС можно в любой смартфон, если его производитель предоставит соответствующую программу (драйвера), которая поддерживает работу этого аппарата, добавил он. «Но такие производители, как Apple, в этом не заинтересованы», — отметил Смирнов.

Представитель Yota Devices не ответил на вопрос о том, готова ли компания выпускать устройства на Sailfish.

Не первый случай
Попытки создать российскую операционную систему ведутся не первый год. В конце 2011 года Минкомсвязи утвердило прототип «российской Windows» — национальной программной платформы (НПП), которую, как предполагалось, будут использовать чиновники и госслужащие. Конкурс на ее разработку выиграла компания «Пингвин софтер» (принадлежит бывшему главе Минкомсвязи Леониду Рейману через фонд NGI).

Планировалось, что Минкомсвязи выделит на создание продукта 490 млн руб. в 2011–2012 годах в рамках госпрограммы «Информационное сообщество».

Но никаких средств аналог Windows не получил, вспоминает Смирнов. «Минкомсвязи в одном из отчетов написало, что исполнитель не предоставил в срок качественное техническое задание», — рассказал эксперт. В тот год НПП не получила денег, а позже произошла смена кабинета министров (в 2012 году президент Владимир Путин назначил главой Минкомсвязи Николая Никифорова, до этого момента его место занимал Игорь Щеголев), добавил он.

0

14

“Поиск в глубоком Интернете” может помочь ученым

Когда вы делаете обычный поисковый запрос через поисковую систему, полученные вами результаты не отражают всей картины целиком. В Интернете находится гигантское количество информации — иногда называемой «глубоким Интернетом» (Deep Web) — которое не индексируется поисковыми системами: информации, которая может оказаться полезной при отслеживании преступников, террористов и торговцев людьми. Ученые же могут использовать возможности глубокого Интернета для поиска снимков и данных, полученных с космических аппаратов.

Агентство по перспективным оборонным научно-исследовательским разработкам США (Defense Advanced Research Projects Agency, DARPA) разрабатывало специальные инструменты для поиска информации в рамках своей программы Memex, которая позволяет осуществить доступ к этой таинственной онлайн-Вселенной и индексировать её. Исследователи из Лаборатории реактивного движения НАСА (JPL) присоединились к проекту Memex, чтобы поставить преимущества доступа к глубокому Интернету на службу науке. Программа Memex, к примеру, могла бы помочь каталогизировать гигантские количества данных, которые космические аппараты НАСА поставляют на Землю на регулярной основе.

«Мы разрабатываем поисковые технологии нового поколения, которые способны распознавать людей, места, предметы и связи между ними», — сказал Крис Мэтманн, руководитель исследования, проводимого JPL в рамках программы Memex.

Система Memex проверяет не только стандартный текстовый контент, находящийся в открытом доступе, но также снимки, видео, всплывающие окна с рекламой, формы, скрипты и другие способы хранения информации, устанавливая взаимосвязи между ними.

«Мы совершенствуем поисковых роботов, давая им возможности вести себя, подобно браузерам — другими словами, исполнять скрипты и «прочитывать» рекламные объявления точно так же, как это делали бы вы сами, сидя за компьютером. Обычно такая информация не индексируется поисковыми движками», — сказал Мэтманн.

Все программные коды, написанные для Memex, являются открытыми. Команда JPL является одной из 17 команд, работающих над этой инициативой агентства DARPA.

0

15

Зря они это:
Google научил искусственный разум понимать русский язык

МОСКВА, 7 мар – РИА Новости. Компания Google объявила о том, что система Google Translate теперь использует искусственный интеллект для перевода текстов с русского и на русский язык. Об этом сообщил в своем блоге Барак Туровский, ведущий разработчик системы перевода Google.

"В ноябре прошлого года наши пользователи из Турции, Бразилии и Японии заметили, что Google Translate начал заметно лучше понимать их языки. Это произошло благодаря тому, что мы начали использовать глубинные нейронные сети для перевода целых предложений, а не отдельных слов, сразу для восьми языков мира. Сегодня к ним присоединяются хинди, русский и вьетнамский, а через несколько недель – множество других языков", — заявил инженер.

В последние несколько лет компания Google начала активно развивать и использовать различные формы искусственного интеллекта для поиска информации в сети, обработки фотографий и их каталогизации и множества других целей, где классические алгоритмы обработки данных не работают. Ярким примером этого подхода стала система искусственного интеллекта AlphaGo, которая в прошлом году открыто обыграла чемпионов мира и Европы по го и анонимно победила сотни топ-игроков в онлайн-системах этой древнекитайской игры.

Большая часть этих разработок основывается на так называемых глубинных, или сверточных нейросетях. Они представляют собой каскады или многослойные структуры из нескольких десятков или сотен более простых нейросетей. Каждая из них обрабатывает не исходные данные, а продукты анализа, полученные сетью, расположенной выше, что позволяет упрощать очень сложные проблемы и решать их при помощи относительно скромных вычислительных ресурсов.

Нечто похожее происходит и при использовании искусственного разума для перевода с одного языка на другой. Когда система Google Translate "читает" переводимый текст, то она не пытается перевести его по фразам или отдельным словам, а ищет ответ целиком, используя данные, накопленные при анализе текстов, переведенных человеком. Это, как объясняют разработчики алгоритма GNMT, позволяет избежать проблем с редкими или неправильно написанными словами, которые обычно смущают классические системы машинного перевода. По оценкам программистов, переход на нейросети снизил уровень ошибок в переводах Google Translate на 60%.

Подобная система, как показывают внутренние тесты Google, позволяет добиться почти человеческого качества перевода для некоторых пар языков, таких как французский и английский или английский и испанский. Кроме того, искусственный интеллект сделал автоматический перевод с самых сложных языков, таких как китайский, понятным для читателя.

0


Вы здесь » Амальгама » Математика и программирование » Лента новостей - Математика и программирование