Магия звука. как российские инженеры заинтересовали amazon и подругу илона маска и привлекли миллионы долларов инвестиций

Що можна відправляти через поштомати?

Через поштомати можна відправляти посилки вагою до 10 кг — документи, електронну комерцію та будь-які інші малогабаритні відправлення. Крім того, з 7 грудня до 31 січня замовити безкоштовну доставку товарів у поштомати Meest можна у популярних онлайн-магазинах: техніки, одягу, будівельних, дитячих та косметичних товарів, а також у книгарнях.

Крім цього, Meest пропонує послугу надшвидкої доставки по Києву за 5 годин. Для цього потрібно вкласти посилку в поштомат до 11:00.

Meest — міжнародна група компаній, що веде свою діяльність більш ніж у 20 країнах світу. На українському ринку компанія розвиває власну мережу поштоматів, яка зараз налічує понад 1500 автоматизованих пристроїв. Наразі автоматичні термінали Meest — єдині в Україні, що працюють і на отримання, і на відправлення посилок.

«Умный» чат-бот

Люди нередко путают эти две разновидности, что приводит к искажению картины мира. Кто-то начинает подозревать наличие сознания у современных виртуальных собеседников, кто-то — обвинять создателей прикладных систем в том, что они занимаются «ненастоящим» ИИ.

В 1950-е годы ни у кого не было сомнений, что система ИИ, способная победить чемпиона мира по шахматам, это и есть «настоящий ИИ».

После победы Deep Blue над Каспаровым, в качестве «водораздела» стали приводить игру го, якобы неподвластную «ненастоящему ИИ» и так далее. Какие-то из кажущихся недостижимыми для него задач давно решены, хотя люди могут просто не знать об этом. Кто-то скажет, что машины не умеют обучаться (хотя машинное обучение существует с 1950-х), кто-то — что они не умеют разбираться в человеческих эмоциях (хотя системы так называемого сентимент-анализа или анализа тональности текста успешно справляются с этим в течение последнего десятилетия). Еще кто-то может заявить, что машины не могут, скажем, сочинять музыку (хотя в 2019 году впервые в истории был подписан контракт между крупным музыкальным лейблом Warner Music и компанией Endel, создавшей систему для алгоритмической генерации музыки).

Гипотеза 1 — о персональной музыке

“Настало время вашего персонального саундтрека” убеждал всех Пьер Барро, основатель компании Aiva Technologies, на очередном выступлении TED в 2018 году.

Идея кажется логичной и абсурдной одновременно, но достаточно авантюрной, чтобы поднять инвестиций и хайпа под рабочий прототип и авантюрную идею.

Aiva Technologies начинали так же с классической музыки (я понятия не имею, почему, но много кто с этого начинает), но демострация таких произведений со всеми скрипками, виолончелями дает очень мощный маркетинговый эффект — впечатление.

Работает это обычно так — ИИ, сочиняя музыку, на выходе выдает midi файлы, грубо говоря, это ноты. Дальше “ноты” озвучиваются либо живыми оркестрами, либо виртуальными инструментами в специальном софте — Digital audio workstation (DAW).

Так выглядит DAW Ableton, unsplash.com

Например, в 2017 году на Yet Another Conference Яндекса устроили именно такое шоу — нейронная сеть написала произведение по мотивам композитора Скрябина.

И это классный элемент шоу, как в случае с примерами на TED и YAC, но за рамки перформанса, на настоящий рынок, он не выходит.

Со временем гипотеза Aiva Technologies о том, что люди будут слушать ИИ-музыку, потому что им нужно что-то персональное — не подтвердилась. Поэтому они пошли в другом направлении — создание инструментов для музыкантов, кто пишет музыку с использованием DAW.

Иными словами, алгоритм пишет “заготовки” произведений в нужном стиле и тональности, а дальше музыкант может их корректировать и создавать уникальный трек. Или использовать как есть. Где-нибудь.

Но дело в том, что это уже вообще другой рынок — существуют целые аудио стоки и биобиотеки таких заготовок, написанный живыми людьми. Очень много такого контента распространяется вообще бесплатно, например, есть сайт midiworld, где можно найти любимую песню и преобразовать ее в midi. И никаких тебе авторских прав.

И я, конечно, надеюсь, что все у Aiva Technologies получится, но рынок так себе, если честно.

Что случилось

Сервис краткосрочной аренды жилья Airbnb провел первое публичное размещение акций. Первоначально компания хотела продавать ценные бумаги по $44-50. Впрочем, в начале декабря Airbnb повысила ценовой диапазон до $56-60 за штуку, а затем до $68. В первый день торгов акции компании подорожали на 112% — до $144,7 на закрытии.

Рыночная стоимость Airbnb достигла $86,5 млрд. По данным Business Insider, это больше совокупной капитализации трех ведущих мировых гостиничных сетей: Hilton Worldwide Holdings ($29,7 млрд), Marriott International ($42,7 млрд) и Intercontinental Hotels Group ($8,7 млрд). На закрытии они в общем стоили $84,1 млрд.

Это был тяжелый год для Airbnb. В начале 2020-го перспективы туристической отрасли поставила под удар пандемия. В апреле в рамках долгового финансирования Airbnb даже согласилась на снижение оценки с $31 до $18 млрд. Затем туристы стали избегать крупных отелей и отдавать предпочтение частному жилью, что положительно повлияло на Airbnb. В июле сервис сообщил, что его клиенты впервые с 3 марта забронировали более 1 млн ночей за один день.

Про сложности

Сложности, как и у любого цифрового продукта, связаны с привлечением и удержанием пользователей. Это не уникальная проблема, она для всех примерно одинакова: люди приходят, не понимают по каким-то причинам твой продукт и уходят. Для нас это особенно сложно, потому что мы, по сути, создаём новую категорию, и человеку неочевидно, что делать в нашем приложении, как им пользоваться. Поэтому мы постоянно работаем над первой продуктовой сессией, объясняем человеку, какие данные мы собираем и как их используем для создания звукового фона.

Также, когда мы только запустили продукт, было очень много фидбэка, который мы называем «играет одно и то же». На самом деле продукт утилитарный, функциональный, а люди начинают его слушать, как будто это музыка. И разумеется они не чувствуют тонких, маленьких, буквально микроскопических изменений soundscap’а. Мы пошли на поводу у этого фидбэка и попытались более ярко, выпукло реагировать звуком на изменение вводных данных. Тогда люди начали говорить, что звук стал слишком разнообразным и отвлекающим. Так мы постоянно находимся в поиске баланса: как сделать так, чтобы человеку было очевидно, что это не просто играет по кругу какая-то предзаписанная эмпэтришка. Но и не скатиться в какое-то развлечение, потому что мы разрабатываем продукт не для того, чтобы развлекать человека, а чтобы помочь решить ему понятную задачу.

Другая большая проблема состоит в привлечении пользователей. Сейчас платный маркетинг в том виде, в котором им все пользовались даже год назад, очень сильно лихорадит. Причин много: соцсети вводят новые правила, ужесточается регуляция рынка со стороны платформ типа Apple, стоимость установки постоянно растёт, хаос в информационном пространстве, всё больше проектов появляется в категории health and fitness. В итоге мы видим какие-то сумасшедшие цены за одного привлечённого пользователя.

Эту проблему мы решаем с помощью поиска других точек роста, напрямую не связанных с платным привлечением. Например, коллаборациями с артистами. Во сколько они нам обходятся — это коммерческая тайна, но органика и коллаборации являются самыми мощными источниками привлечения пользователей.

Но платную рекламу в Facebook, Instagram, influence-маркетинг мы всё равно используем. Из перечисленных каналов Instagram для нас наиболее эффективен.

2019: Warner Music заключила первый в истории контракт с исполнителем-алгоритмом Endel

27 марта 2019 года появилась информация о том, что Warner Music заключила первый в истории контракт с исполнителем-алгоритмом Endel, создающим музыкальные композиции под настроение пользователя в текущий момент. По условиям контракта, в течение года нейросеть Endel выпустит 20 уникальных альбомов. На март 2017 года пять альбомов уже доступны для скачивания в iTunes, при этом все альбомы созданы, как выражаются разработчики, «нажатием одной кнопки».

Endel разработан одноименным стартапом, сооснователем и исполнительным директором которого выступает игровой журналист россиянин Олег Ставицкий. По утверждению разработчиков алгоритма, Endel адаптируется к настроению пользователя и помогает ему в зависимости от поставленных задач — музыка нейросети помогает заниматься спортом, работать, засыпать или медитировать. При этом ИИ сам определяет, что требуется человеку в данный момент, анализируя множество параметров: время суток, геолокацию, погоду за окном, пульс и частоту биения сердца человека.

Мы на пороге затопления рынка системами автоматической и процедурно-сгенерированной музыки, продукт которых удовлетворит большинство людей в большинстве ситуаций, — утверждает аналитик рынка Холли Херндон.

По мнению эксперта, дальнейшая трансформация рынка музыки и шоу-бизнеса будет происходить ускоренными темпами. Как известно, в Китае и Корее концерты полностью виртуальных исполнителей — уже обычное дело, а число фанатов «цифровых» кумиров исчисляется миллионами. Теперь эта тенденция, полагает аналитик, будет распространяться и на более консервативном западном рынке.

Подмена понятий

«Совсем скоро ИИ заменит человека!» — похожие слова часто можно встретить в СМИ, но так говорить не совсем корректно по нескольким причинам

Во-первых, важно понимать разницу между «ИИ» в глобальном смысле и «системами ИИ». Под «искусственным интеллектом» специалисты понимают направление в науке и технологиях, занятое автоматизацией решения интеллектуальных задач или, как емко выразился изобретатель и футуролог Рэймонд Курцвейл, «искусство создания машин, выполняющих функции, требующие интеллекта в случаях, когда их выполняют люди»

В этом смысле с ИИ произошла примерно такая же неприятная история, как с экологией, когда название науки стали повсеместно употреблять вместо понятия «окружающая среда».

Если же мы говорим именно о системах ИИ, реальных и гипотетических, то их все можно разделить на две разновидности:

  1. Системы прикладного ИИ (applied AI) — узкоспециализированные системы, предназначенные для решения какой-либо одной интеллектуальной задачи или небольшого множества таковых.

  2. Системы универсального ИИ (Artificial General Intelligence, AGI), которые подобно человеческому разуму будут способны решать неограниченно широкий спектр интеллектуальных задач и, возможно, даже обладать сознанием.

Таких «умных машин» пока не существует.

Гипотеза 4 — А не продать ли это стриминговым сервисам?

Музыкальные стриминговые сервисы в мире работают не так, как в Apple Music и Яндекс.Музыка. Многие из них работают по ad-supported модели — музыку можно слушать бесплатно, просто периодически в наушниках будет “возникать” реклама. Избавиться от рекламы можно через платную подписку на сервис. Spotify, например, работает именно так.

Рейтинг использования стриминговых платформ, % населения США старше 12 лет. INFINITE DIAL 2019 https://www.edisonresearch.com/wp-content/uploads/2019/03/Infinite-Dial-2019-PDF-1.pdf

Но вот только не все так радужно со стриминговыми сервисами. Дело в том, что все они убыточные, в том числе Spotify. Разница только в том, что у остальных стриминговых сервисов есть “крыша” в виде материнской компании, и они просто держат долю рынка на случай, если ситуация изменится, и кто-нибудь все же “хакнет” этот вопрос.

В 2016 году, Spotify все же попытался заработать и “получил” от Warner Music Group.

Шведский стриминговый проект (это я все еще про Spotify) создавал и продвигал плей-листы с настроенческой музыкой и/или каверами от продакшн хаусов (агентства, создающие музыку для коммерческого использования). Треки от продакшн-хаусов стоят дешевле и иногда вообще не облагаются коммисиями от прослушиваний. Поэтому такие манипуляции проводились для того, чтобы немного увеличить маржу Spotify, так как с мейджор лейблами, такими как Warner, Universal и т.д. не разгуляешься.

И кажется логичным, что на место продакшн-хаусов может встать искусственный интеллект. И тогда и стриминговые сервисы начнут зарабатывать, и ИИ-стартапы найдут свою нишу.

Но дело в том, что когда лейблы об этом узнали, они назвали Spotify предателями, стали требовать увеличить процент выплат за прослушивания, что на самом деле фатально для компании.

А фатально потому, что если Spotify увеличивает размер выплат одному из своих партнеров, например, Warner Music Group, то остальные лейблы начнут возмущаться и аппелировать к статусу Всемирной Торговой Организации — Most-Favored Nation, то есть анти-дискриминационной политике. Перевожу — “если вы поднимите выплаты одному лейблу, то повышайте выплаты другим”. И тогда Spotify окажется в не очень приятном положении.

Речь идет действительно о больших деньгах:

  • 70% всей выручки Spotify уходит на оплату комиссий правообладателям;
  • Правобладателями являются лейблы;
  • Стоимость 1 стрима стрима варьируется от $0,006 до $0,0084 — это суммы, которые перечисляются лейблам;
  • Лейблы перечисляют от 15% до, в некоторых случаях, 50% от этих средств артистам;

А теперь внезапно вспоминаем, что примерно такая же ситуация была и в видео сервисах, типа Netflix и Amazon. Тогда оказалось, что производство собственного контента приводит к большей марже, чем покупка лицензий у киностудий.

Почти “хакнули” систему, но стриминговые сервисы все-таки очень завият от лейблов.

Робототехника

  • Роботы (робототехника)
  • Робототехника (мировой рынок)
  • Обзор: Российский рынок промышленной робототехники 2019
  • Карта российского рынка промышленной робототехники
  • Промышленные роботы в России
  • Каталог систем и проектов Роботы Промышленные
  • Топ-30 интеграторов промышленных роботов в России
  • Карта российского рынка промышленной робототехники: 4 ключевых сегмента, 170 компаний
  • Технологические тенденции развития промышленных роботов
  • В промышленности, медицине, боевые (Кибервойны)
  • Сервисные роботы
  • Каталог систем и проектов Роботы Сервисные
  • Collaborative robot, cobot (Коллаборативный робот, кобот)
  • IoT – IIoT – Цифровой двойник (Digital Twin)
  • Компьютерное зрение (машинное зрение)
  • Компьютерное зрение: технологии, рынок, перспективы
  • Как роботы заменяют людей
  • Секс-роботы
  • Роботы-пылесосы
  • Искусственный интеллект (ИИ, Artificial intelligence, AI)
  • Обзор: Искусственный интеллект 2018
  • Искусственный интеллект (рынок России)
  • Искусственный интеллект (мировой рынок)
  • Искусственный интеллект (рынок Украины)
  • В банках, медицине, радиологии, ритейле, ВПК, производственной сфере, образовании, Автопилот, транспорте, логистике, спорте, СМИ и литература, видео (DeepFake, FakeApp), музыке
  • Национальная стратегия развития искусственного интеллекта
  • Национальная Ассоциация участников рынка робототехники (НАУРР)
  • Российская ассоциация искусственного интеллекта
  • Национальный центр развития технологий и базовых элементов робототехники
  • Международный Центр по робототехнике (IRC) на базе НИТУ МИСиС

Robot Control Meta Language (RCML)

  • Машинное обучение, Вредоносное машинное обучение, Разметка данных (data labeling)
  • RPA – Роботизированная автоматизация процессов
  • Видеоаналитика (машинное зрение)
  • Машинный интеллект
  • Когнитивный компьютинг
  • Наука о данных (Data Science)
  • DataLake (Озеро данных)
  • BigData
  • Нейросети
  • Чатботы
  • Умные колонки Голосовые помощники
  • Безэкипажное судовождение (БЭС)
  • Автопилот (беспилотный автомобиль)
  • Беспилотные грузовики
  • В мире и России
  • Летающие автомобили
  • Электромобили

Беспилотный летательный аппарат (дрон, БПЛА)

Четвертый закон робототехники

Нейросети уже давно используются в анализе больших данных и гуманитарных науках: с помощью машин изучают рабство в Техасе в 1840-х, тематику творчества рэп-исполнителей и помогают в точном земледелии. Но когда речь заходит о производстве креативного продукта, задачи ИИ к аналитике не сводятся. Строго говоря, здесь существуют две группы задач: ассистировать деятелям творческих профессий в работе над произведением — брать на себя рутинные задачи и оставлять человеку больше времени на разработку общего концепта. Либо, собственно, творить произведение на основе загруженных данных. Оба направления стремительно развиваются.

Так, в 2018 году американский писатель Робин Слоун поделился опытом совместного творчества с нейросетью. Слоун работал так: писал часть предложения, а затем кликал на кнопку, чтобы нейросеть, построенная на открытой модели GPT-2, дописала предложение сама, используя контекст и загруженные в нее ранее данные. Предварительно Слоун собрал целый корпус текстов, который «скормил» нейросети: туда вошли романы Джона Стейнбека, Джоан Дидион и Филипа Дика, рассказы американских фантастов, интервью с разработчиками из Кремниевой долины и поэзия Джонни Кэша. Сам Слоун при этом не относится к технооптимистам и не думает, что ИИ когда-нибудь станет писать романы за людей. Это всего лишь инструмент — не замена человека.

«Если взвесить все «за» и «против», люди все равно предпочтут читать тексты, написанные человеком с настоящим жизненным опытом, который пишет о реальности человеческого существования», — считает Слоун.

Достойны упоминания еще несколько случаев сотворчества компьютера и писателя. Например, в 1993 году для романа «Только на этот раз» Скотт Френч создал специальную программу, чтобы сымитировать стиль популярного автора любовных романов Жаклин Сьюзан, а компания Botnik Studios экспериментировала с фанфиками по «Гарри Поттеру», написанными нейросетью.

Но сейчас ИИ помогает не только писателям. В 2016 году Sony запустила нейросеть-ассистент Flow Machines, которая способна предлагать музыкантам готовые аранжировки и мелодии, основываясь на уже написанной музыке. Еще в девяностые Дэвид Боуи помогал разрабатывать Verbasizer — рандомный генератор слов для песен. А художники уже давно используют алгоритмы нейросетей, чтобы исправлять дефекты в работах и применять готовые модели.

Но робот-ассистент — это одно. А как насчет робота-творца?

Про коллаборацию с Граймс

Вообще, с начала эпидемии на нас вышло огромное количество менеджеров разных музыкантов. Потому что они сейчас не могут давать концерты, со стримингом все уже наигрались, и возник вопрос, как взаимодействовать с аудиторией и монетизировать своё творчество.

На нас вышли в том числе менеджеры Граймс, и мы договорились о сотрудничестве. Граймс — пользователь Endel, она хорошо понимает, что мы делаем, и поэтому мы решили начать серию коллабораций именно с неё.

Певица создавала кусочки семплов по нашим гайдлайнам, чтобы те звуки, которые она производит, работали на основе нашей научной базы. Искусственный интеллект генерирует из набора семплов бесконечную колыбельную.

В первые несколько дней после запуска нашей коллаборации приложение скачали 100 000 раз. Увеличилось число подписчиков и прослушиваний. Средняя длина сессии выросла с 60 минут до 70, а у особо хардкорных фанатов — до 120 минут.

Гипотеза 3, в которой робот становится медийным персонажем

Некоторые проекты пошли по неочевидному пути — через становление медийным персонажем. Например, у того же российского проекта генеративной музыки Mubert в Японии есть даже фанаты и фанатки. Получается, что алгоритм опять выходит на одну арену конкуренции с живыми музыкантами, но на этот раз в другой роли, где его недостатки стали преимуществом — среди женщин и мужчин он — единственный робот.

Конечно, Япония — страна специфическая, стоит загуглить, что у них происходит в телеэфирах и понять, что реакцию Японии не стоит экстраполировать. Однако, несмотря на легкую неадекватность хайпа в стране восходящего солнца, за ее пределами новую медийную кибер-личность тоже слушают.

И вот уж мало кто ожидал, что музыкальный AI будет использоваться по его прямому назначению — генерировать музыку для людей, чтобы они просто слушали ее. Круг замкнулся.

Таких людей не очень много, то есть рынок не очень большой. Но есть те, кому реально нужна просто фоновая музыка. Музыка, которая будет играть, пока они пишут статьи (я сейчас пишу под поток из Mubert), пишут код, рисуют, медитируют, читают книги и так далее.

Вы, наверное, подумали, так чем Mubert отличается от той же Aiva Technologies? У Mubert есть свое мобильное приложение, которое создает этот фоновую музыку в реальном времени. В случае с Aiva — вам придется зайти на сайт, нагенерить там много треков, залить на телефон и только тогда у вас будет фоновая музыка. Ничего личного, как говорится, просто мобильное приложение.

Но если подумать, раз уж можно генерировать музыку, то можно генерировать и голос. А речь генерируют лучше всех голосовые помощники. В России есть свой “медийный персонаж” — Алиса Яндекса. И у Алисы есть свой альбом, который она “выпустила” в 2017 году, в которой текст, музыка и голос полностью синтезированы.

Но пока это все-таки больше про хайп, нежели про реальный рынок.

Рай для технопессимистов

Споры о том, насколько быстро и в каком масштабе роботы смогут вытеснить людей в различных профессиональных сферах, ведутся давно.

Одни считают, что это коснется, в основном, рутинных операций, что позволит освободить людей для творчества. Другие предостерегают, что, во-первых, человечеству не нужно будет такое количество творческих специальностей, а во-вторых, системы ИИ уже сейчас делают, и зачастую успешно, то, что традиционно считалось прерогативой человека — сочиняют рассказы, пишут статьи, рисуют картины и придумывают музыкальные произведения. Третьи уверены, что наши страхи по этому поводу преувеличены, и если роботы когда-то и смогут повсеместно заменить нас, то случится это совсем не скоро. Кто прав, рассуждает Сергей Марков.

Об эксперте: Сергей Марков — руководитель Управления экспериментальных систем машинного обучения, департамент SberDevices, ПАО «Сбербанк».

Гипотеза 2 — Реклама и видео-продакшн

Как мы знаем, деньги там, где реклама. Здесь речь пойдет о видео-рекламе с фоновой музыкой. За все приходится платить, в том числе и за музыку, и вот по какому принципу:

  • Аудио стоки — это библиотеки с композициями для коммерческого использования. Композиторы пишут разнообразную музыку и выкладывают их на стоки. Лицензия на использвоание такой музыки может варьироваться от $10 до бесконечности. Весь Голливуд сидит на аудио стоках, ТВ реклама, пре-роллы в Youtube тоже содержат стоковую музыку.
  • Композитор или покупка прав на известную песню — это решение для ребят с бюджетом. Привлечь “приличного” композитора в России на написание фоновой музыки будет стоить от 100 тыс. рублей, а купить лизенцию на, например, песню The Rolling Stones (и я сейчас о группе, не о журнале) обойдется в несколько миллионов.

Как вы понимаете, аудио стоки — большой рынок музыки среднего качества. При этом контента там мало, и его всегда не хватает — например, на одном из самых крупных стоков audiojungle хранится всего лишь около 500 тысяч треков.

И здесь мы опять вспоминаем об искусственном интеллекте, который генерирует фоновую музыку ровно такого же качества, нужной тональности и длительности и даже могут по референсу написать похожую.

Но что-то пошло не так, на этом, насколько мне известно, никто много не заработал. Возможно, потому что креативщики (звукорежиссеры, продюсеры, режиссеры, монтажеры и другие ребята) не создают контент линейно, а руководствуясь чувствами, настроением и так далее. Или потому, что генеративная музыка не особо облегчает их работу.

Дальше потоковая генеративная музыка начала “сваливаться” в фоновый стриминг —в киберспорт, tiktok и другие площадки (в том числе в магазинах, салонах красоты и т.д.), где требуется поток фоновой музыки. Например, подписка на фоновую музыку (то есть не написанную алгоритмом) стоит тысяч так 600 рублей в год (инсайдерская информация) для сетевых магазинов. А проект Mubert предлагает генерировать музыку за ~ 40$ в месяц.

И вроде бы есть экономическая ценность, но в этом сегменте AI опять конкурирует с настоящими музыкантами и оригинальными треками с вокалом, которого у ИИ пока нет.

2016: Google запускает Magenta для создания музыки и видео нейронными сетями

В мае 2016 года компания даже запустила специальный проект Magenta, основная задача которого заключается в изучении креативных возможностей нейронной сети. Ученые планируют осваивать премудрости творческого процесса постепенно: сначала будет разработан алгоритм для создания музыкальных произведений. Затем настанет очередь видео и изобразительного искусства. Данные о результатах работы планируется размещать в открытом доступе на GitHub.

Буквально через пару недель после открытия Magneta, была запущена программа по импорту музыкальных файлов MIDI-формата в систему TensorFlow с целью обучить искусственный интеллект созданию музыки. Однако пока результаты работы программы не столь удачны (хотя справедливости ради нужно сказать, что прошло еще не так много времени).

Искусство против рутины

Важно понимать, что системы ИИ создаются, прежде всего, как инструменты для решения различных актуальных задач: повышения производительности труда, уменьшения доли монотонных или опасных для людей процедур и, наконец, для расширения человеческих возможностей. Сегодня писатели и художники используют в своей работе инструменты, которые еще век назад просто не существовали — текстовые редакторы с автоматической проверкой орфографии, отслеживанием истории изменений, возможностью копирования текста, графические планшеты и графические редакторы со множеством возможностей и т.д

Они избавили людей от нудных операций, дав им возможность сосредоточиться на творчестве

Сегодня писатели и художники используют в своей работе инструменты, которые еще век назад просто не существовали — текстовые редакторы с автоматической проверкой орфографии, отслеживанием истории изменений, возможностью копирования текста, графические планшеты и графические редакторы со множеством возможностей и т.д. Они избавили людей от нудных операций, дав им возможность сосредоточиться на творчестве.

Заменили ли эти инструменты человека? Ведь теперь у писателя и художника стало уходить меньше времени на создание произведений. Значит, теперь нашему обществу нужно меньше художников и писателей? Очевидно, что это не так. Более того, в современном обществе число людей, занятых производством текстов и изображений, куда больше, чем сто лет назад. Этот, казалось бы, парадоксальный факт связан с тем, что в действительности количество потребляемого обществом текстового и визуального контента существенно выросло.

В 1950-е годы на США приходилось несколько десятков компьютеров. Вся вычислительная мощь компьютеров NASA, использованных в американской лунной программе, уступает недорогому современному смартфону. Значит ли это, что все вычислительные задачи уже решены, а математики лишились работы? Нет, мы находим применение удивительным вычислительным ресурсам. Появление новых «умных» инструментов открывает перед человечеством новые возможности.

Это вполне понимают исследователи, занятые сегодня созданием систем ИИ, и, как говорится в манифесте проекта Social AI and Extended Intelligence исследовательской группы Human Dynamics в MIT, вместо того, чтобы соревноваться с машинами, нужно понять, что комбинация человек + ИИ будет работать лучше, чем люди и ИИ, действующие в одиночку.

Подписывайтесь на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.

Портрет художника-алгоритма

Здесь тоже первыми среди роботов-производителей контента стали ИИ-художники, работы которых успели превратиться в отдельный жанр. Уже совсем скоро нейросети смогут «похоронить» традиционную для комикс-индустрии профессию колориста: бета-разработка программы Clip Studio от Celsys умеет автоматически накладывать цвета на черно-белый рисунок. Алгоритмом уже заинтересовались аниме-студии и издатели манга, а художник Жоао До Лаго, работавший, в частности, над аниме-сериалом Castlevania для Netflix, считает, что автоматическая колоризация освободит от уймы усилий художников, которым ранее приходилось тратить много времени на создание узнаваемого и в то же время уникального визуального стиля произведений.

Но роботы-художники шагнули дальше профессии колориста. В октябре 2018 года с молотка ушел первый портрет, написанный нейросетью: «Портрет Эдмонда Белами» был продан за 432 тыс. долларов — цена в десять раз превысила заявленную стоимость картины.

Фото: christies.com

Не отстают и машины, генерирующие текст. В мае 2020 года OpenAI представила уже третью версию алгоритма генерации текстов GPT, которую обучили на 175 млрд параметров. Один из пользователей Reddit несколько недель назад получил доступ к GPT-3 и сгенерировал два рассказа — в стиле Нила Геймана и Терри Пратчетта. Журналист и медиаэксперт Александр Амзин перевел рассказ в «геймановском стиле», потому что «когда прочел его, стало по-настоящему страшно». По мнению Амзина, уже через несколько поколений алгоритм научится генерировать «вполне интересные тексты».

А пару лет назад построенная совместно «Яндексом» и «Кинопоиском» нейросеть написала довольно пугающий рассказ на основе произведений Николая Гоголя. Тот же самый алгоритм еще в 2016 году написал альбом «Нейронная оборона», опираясь на мелодию и лирику легендарной группы Егора Летова.

И все же у развития нейросетей есть существенное ограничение. Оно связано с вычислительными мощностями. Исследователи из Массачусетского технологического института проанализировали более тысячи научных публикаций на тему глубокого обучения

Особенное внимание уделили таким применениям технологии, как классификация изображений, обнаружение объектов, ответы на вопросы, распознавание именованных сущностей и машинный перевод. Для каждой публикации оценили количество вычислительных операций и объем мощностей, необходимых для создания модели определенной точности

Оказалось, что даже при значительном увеличении вычислительных мощностей точность современных моделей возрастает незначительно, а большее увеличение мощностей потребовало бы огромных сумм и серьезной нагрузки на экологию.

Ждать ли нам сценариев от писателей-роботов и картин «кисти» цифровых художников? Судя по всему, пока что это — очень отдаленная перспектива, реализация которой напрямую связана со способностью технологических компаний обеспечить ресурсы для новых самообучающихся систем. И хотя роботы уже способны на высоком уровне генерировать «формульные» (то есть, основанные на готовой сюжетной схеме) рассказы, их творчество все еще подчинено замыслу человека за клавиатурой.

Если же и представить себе роботов будущего, которые, как в романах Виктора Пелевина, создают собственные тексты, то можно предположить, что в этом случае авторство просто перейдет «уровнем» выше: гонорары станут получать не машины, а работающие с ними люди или целые компании. Именно так сейчас происходит с ИИ-художниками. До подлинного же творческого начала в машинах еще далеко.

Почему это интересно

Sequoia Capital — легендарная американская венчурная компания. Она известна инвестициями в Apple, Google, Instagram и другие знаменитые компании. Согласно The Information, в 2009 году Sequoia инвестировала в Airbnb, купив 58 млн акций за $585 000. В то время на площадке было только 2500 объявлений и 10 000 зарегистрированных пользователей.

Sequoia также участвовала в нескольких последующих раундах финансирования. В итоге она потратила около $280 млн на покупку почти 82 млн акций. В среднем — $3,40 за ценную бумагу. 10 декабря курс акций Airbnb составлял $144,7 за штуку. Это значит, что доля Sequoia стоила около $12 млрд. Таким образом, компания получила приблизительно 43-кратную прибыль.

«Деятелям искусства пока рано менять работу»

Комментирует Павел Осиненко, старший преподаватель Центра по научным и инженерным вычислительным технологиям для задач с большими массивами данных Сколтеха CDISE:

Любой вопрос из разряда «сможет ли ИИ заменить человека в том-то и том-то?» так или иначе сводится к вопросу: «Обладает ли естественный (человеческий) интеллект некой неалгоритмической природой, которую принципиально нельзя реализовать в вычислительном устройстве?». «Реализовать» — в смысле воспроизведения функции, идентичной таковой у естественного интеллекта.

Вопрос может показаться несколько далеким от науки и технологий и, скорее, близким к философии, но так или иначе любая цепочка аргументации приведет именно к нему. Поэтому принимая по нему ту или иную точку зрения, мы придем к выводу, что либо человек незаменим принципиально в той или иной области, либо любая функция естественного интеллекта принципиально воспроизводима в вычислительном устройстве.

Наше понимание работы мозга постоянно совершенствуется, и только за последние десятилетия достигнут огромный прогресс. Скажем, мы стали лучше понимать то, как синаптические соединения формируют некоторые ассоциации. Активно развивается направление моделирования мозга: например, Blue Brain Project не так давно анонсировал симуляцию фрагмента крысиного «серого вещества».

А некоторые заходят так далеко, что считают всю Вселенную результатом вычислений. Такую точку зрения выражали Илон Маск и физики Стивен Вольфрам, Макс Тегмарк. Действительно, чем можно объяснить такой небывалый успех именно вычислительной математики в описании и преобразовании мира? Конечно, эти рассуждения, по крайней мере на сегодняшний день, носят философский характер. Я лично не верю в существование некоего невычислимого элемента человеческого сознания, в связи с чем считаю, что принципиально любая функция естественного интеллекта, какой бы высокоуровневой или, если хотите, высокодуховной она ни была, переносима на цифровой носитель. Вопрос тут, скорее, в масштабировании и сложности.

И тут мы подходим к следующей проблеме. Существуют более-менее строго выведенные, фундаментальные пределы того, какие из вычислений в принципе реализуемы во Вселенной. Тут можно упомянуть, скажем, предел Бекенштайна. Теоретически, конечно, пределы вычислений существуют. Но они настолько консервативны, что с практической точки зрения вряд ли помешают когда-то смоделировать, скажем, человеческий мозг. Более релевантны некоторые технические пределы. Например, плотность транзисторов в процессоре. Закон Мура хоронили уже не раз, но пока, видимо, рано. В то же время Google недавно подтвердил достижение квантового превосходства, что станет существенной вехой в развитии квантовых компьютеров.

Да, вычисления с глубокими нейросетями являются тяжеловесными, и иногда исследователи делают акцент скорее на росте вычислительных ресурсов, нежели на оптимизации алгоритмов. Любопытно отметить следующее: обучение с подкреплением, авангард машинного, кажется, является очень хорошим «кандидатом» на применение квантовых компьютеров, а слова о «пределе машинного обучения» скорее всего не стоит воспринимать слишком буквально.

В заключение, отвечая на вопрос: «Так пора ли деятелям искусства искать новую работу?», я бы сказал: «Об этом можно задуматься на досуге, но в ближайшие десятилетия можно, видимо, не напрягаться».

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Лучший совет
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector