Сегодня:
USD 67.0098    CNY 97.7760    EUR 78.3613    JPY 59.6305
Москва +21°C
Последние новости
Популярная актриса из США Элизабет Олсен, известная по роли Ванды Максимофф, в...
Известный актер Александр Семчев был обвинен собственным сыном в том, что он...
Президент России Владимир Путин считает, что в стране должна активнее вестись...

Как заявил специальный представитель ОБСЕ Мартин Сайдик, восток Украины...
Глава президентского Совета по правам человека Михаил Федотов предлагает внести...
Загрузка...
Влияет ли политическая реклама на ваш голос при выборах?
Последние комментарии
елена
депутаты сошли с ума!!! им хорошо з/плата есть и неплохая!! а простым работягам, что??? кто хочет на пенсии работать да...
Сегодня, 17:14
николай
ну а что мне нравится, лишь бы он не был как бензиновый профи, ненадежный и плохо управляемый....
Сегодня, 16:59
Гость Алексей
Нужно запретить управлять любыми транспортными средствами водителям с иностранными правами кроме тех авто которые...
Сегодня, 16:10
Климова Тамара Михайловна
]Народ с реформой получит пенсию в гробу. Молодежь умирает сейчас в 45 лет, а уж до 60 дожить надо.[...
Сегодня, 16:04
Популярные новости

Google научила искусственный интеллект выделять голоса в толпе

14 апр 2018, 20:19, Александр
1 комментарий    4 954 просмотра

Камеры современных смартфонов способны выделять определенный объект из окружения и фокусироваться на нем при съемке. А скоро, благодаря новой технологии на базе искусственного интеллекта, можно будет выделять отдельные голоса в толпе, подавляя все остальные звуки. Данной разработкой занимаются инженеры Google.

Проект не только интересен, но и важен, поскольку компьютеры хуже людей ориентируются в массе звуков: им не под силу так называемый эффект коктейльной вечеринки – умение среди обилия голосов вычленять один конкретный и фокусироваться на нем. Человек же обладает такой функцией, что называется, “из коробки”.

“Автоматическое разделение речи (деление аудиосигнала на отдельные источники) сложнореализуемо на практике”, пишут в блоге софт-инженеры Google Инбар Моссери и Оран Ланг.

Google научила искусственный интеллект выделять голоса в толпе

В своей новой статье они рассказали о модели глубокого обучения, которая сделает возможным распознавание конкретного речевого сигнала в фоновом шуме. “Мы уже добились того, что можем усиливать громкость голоса определенного человека в видеоролике и подавлять прочие шумы”, - сказали Моссери и Ланг. - “Метод работает в видео с одной звуковой дорожкой. Все, что требуется от пользователя – это кликнуть на лицо, голос которого он хочет отчетливо слышать. Также выбор лица может осуществляться алгоритмически на основе контекста”.

Исследователи полагают, что их разработка может иметь широкий спектр применения: от повышения разборчивости речи в видеоконференциях до качественного улучшения слуховых аппаратов.

“Уникальная особенность нашей технологии заключается в объединении звуковых и визуальных сигналов”, - говорят инженеры. - “Например, движения губ сопоставляются со звуками. Это помогает определить, какая часть аудиосигнала относится к данному человеку.

Учет визуальных сигналов не только обеспечивает качественное разделение речи, но и отвечает за привязку аудио к говорящему”.

Нашли ошибку в тексте? Выделите ее, и нажмите CTRL+ENTER

Нравится новость ?

Голосов оставлено: 9

  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent
Загрузка...
Комментарии
Павел Туров от 15 апреля 2018 03:03
Тут я бы отметил, что в нашей стране уже давно ведётся разработка искусственного интеллекта. Это гораздо перспективнее, так как "вычленение голоса" это только сотая часть искусственного интеллекта или даже тысячная часть. Поэтому инженеры Гугла слабаки, так как они работаю на 1 маленькую проблему, а наши инженеры и программисты решают вопрос в комплексе!