Получается, синхронный перевод — это навык, чем-то схожий с физической работой, которую можно делать на автомате. Когда вы учитесь вязать, вы постоянно сверяетесь со схемой изделия, внимательно проверяете, правильно ли провязали петли, не запуталась ли нитка и не ошиблись ли вы с лицевой и изнаночной стороной узора. А как вяжет ваша мама? Не глядя на спицы, она рассказывает вам последние новости и следит за сюжетом фильма на экране телевизора.
Плохие оценки мы часто воспринимаем как следствие отсутствия способностей, а не того, что приложили недостаточно усилий или преподаватель не очень понятно объяснил тему. А еще ребенку может быть просто неинтересно чем-то заниматься, но это тоже не значит, что он к этому неспособен.
«Чтобы решить эту проблему, в "Яндексе" научились применять знания о влиянии языков друг на друга. Например, на трех Карибских островах (Аруба, Бонэйр и Кюрасао) разговаривают на языке папьяменто, который представляет из себя смесь испанского, португальского и английского языков с приправой из различных африканских и еврейских диалектов, завезенных сюда в период Великих географических открытий.
При переводе "Яндекс.Переводчик" понимает, какие слова и откуда были заимствованы, что позволяет использовать модели перевода не только папьяменто, но и "соседних" языков. Аналогично и для других языков — например, идиш во многом похож на немецкий язык, а редкий горномарийский язык развивался под влиянием похожего, но более популярного лугового марийского и русского языков.
Чтобы натренировать нейронную сеть на перевод, требуется большое количество параллельных текстов, как и для статистических систем. При этом разбивка текстов на фразы и соответствие слов не нужны. Нейросеть пытается сначала закодировать исходное предложение в абстрактный набор чисел, а потом декодировать их обратно в слова, но уже на другом языке.
Для этого алгоритм сначала «читает» предложение одновременно и слева направо, и справа налево, а потом предсказывает слова перевода, причем уже сгенерированные слова используются для предсказания следующего.
При обучении без учителя мы даем нейросети набор данных, но не говорим, что с ними делать, — она должна сама найти в этих данных какие-то взаимосвязи. Самая распространенная задача для этого типа обучения — кластеризация. Например, мы можем загрузить коллекцию фотографий разных собак, а модель разделит их по породам, опираясь на размеры, окраску, форму ушей, хвоста и так далее. По сути, алгоритм будет искать похожие снимки и группировать их между собой
важная особенность нейронной сети заключается в том, что она не программируется, а обучается
Нейроны в сети расположены слоями. Первый — входной, на который поступает вводная информация. Она «пробуждает» нейроны, и их активация распространяется дальше — в скрытые слои. В итоге нейронная сеть получает решение задачи — результат выводится через последний, выходной слой. В некоторых нейронных сетях скрытых слоев нет, и сигналы передаются сразу на выходной слой, который и обрабатывает данные, и выдает ответ
Современные нейронные сети могут быть построены по разным моделям, но объединяет их следующее: все они — системы соединенных и взаимодействующих между собой искусственных нейронов (их еще называют узлами нейронной сети). Каждый узел — это упрощенная модель естественного нейрона (клетки нашей нервной системы). Он работает в два этапа: сначала вычисляет взвешенную сумму своих входных данных, а затем применяет функцию активации, без которой нейросеть «выучит» только простые линейные зависимости.
Трансферные системы. Они анализируют исходное предложение, переводят отдельные слова, определяют их функции, а затем собирают новое предложение на целевом языке с учетом его грамматики
Интерлингвистические системы. В них используется язык-посредник — так называемая интерлингва. Ее функции — формальное, абстрактное представление смысла исходного высказывания, которое показывает логические связи между отдельными элементами фразы