Синтезированные голоса, такие же уникальные, как и отпечатки пальцев. Рупал Патель - видеоролик
Изучение английского языка с помощью параллельных субтитров ролика " Синтезированные голоса, такие же уникальные, как и отпечатки пальцев".
Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь.
Всего 828 книг и 2769 познавательных видеороликов в бесплатном доступе.
страница 3 из 3 ←предыдущая следующая→ ...
00:04:47
is how we produce speech.
это то, как мы генерируем речь.
And that happens in one individual.
И всё это происходит
в каждом отдельном человеке.
Now I told you earlier that I'd spent
Ранее я говорила вам, что провела
a good part of my career
добрую часть моей карьеры,
understanding and studying
пытаясь понять и изучить
00:05:00
the source characteristics of people
исходные характеристики людей
with severe speech disorder,
с тяжёлыми нарушениями речи,
and what I've found
и я обнаружила,
is that even though their filters were impaired,
что даже несмотря на то,
что их фильтры были повреждены,
they were able to modulate their source:
они могли модулировать свой источник:
00:05:12
the pitch, the loudness, the tempo of their voice.
высоту, громкость, темп своего голоса.
These are called prosody, and
I've been documenting for years
Их называют «просодиями».
Я документально подтверждала
that the prosodic abilities of these individuals
в течение нескольких лет, что
просодические способности этих людей
are preserved.
сохранены.
So when I realized that those same cues
Когда же я поняла,
что те же самые стимулы
00:05:26
are also important for speaker identity,
важны и для индивидуальности говорящего,
I had this idea.
у меня появилась идея.
Why don't we take the source
Почему бы не взять источник
from the person we want the voice to sound like,
от человека, голос которого
мы хотим воссоздать,
because it's preserved,
ибо он сохранен,
00:05:37
and borrow the filter
и позаимствовать фильтр
from someone about the same age and size,
у кого-то, кто схож
по пропорциям и возрасту,
because they can articulate speech,
владеющего членораздельной речью,
and then mix them?
а затем смешать их?
Because when we mix them,
Ведь, когда мы их смешиваем,
00:05:48
we can get a voice that's as clear
мы можем получить голос,
настолько же чистый,
as our surrogate talker --
как и голос нашего
суррогатного носителя голоса —
that's the person we borrowed the filter from—
того человека, у которого
мы позаимствовали фильтр —
and is similar in identity to our target talker.
и совпадает с индивидуальностью
нашего целевого владельца голоса.
It's that simple.
Вот так просто.
00:06:01
That's the science behind what we're doing.
Таков научный фон нашей работы.
So once you have that in mind,
Как только эта идея появилась,
how do you go about building this voice?
что делать дальше
для создания такого голоса?
Well, you have to find someone
Придётся найти кого-то,
who is willing to be a surrogate.
кто захочет стать суррогатом.
00:06:13
It's not such an ominous thing.
Не такая уж и зловещая вещь.
Being a surrogate donor
Чтобы быть суррогатным донором,
only requires you to say a few hundred
вам только нужно
произнести от нескольких сотен
to a few thousand utterances.
до нескольких тысяч шаблонных фраз.
The process goes something like this.
Процесс происходит примерно вот так.
00:06:24
(Video) Voice: Things happen in pairs.
(Видео)
Голос: Всё имеет пару.
I love to sleep.
Я люблю спать.
The sky is blue without clouds.
Небо голубое и без облаков.
RP: Now she's going to go on like this
Рупал Патель:
Вот так она и будет продолжать
for about three to four hours,
в течение порядка 3—4 часов,
00:06:36
and the idea is not for her to say everything
и идея не в том, чтобы сказать всё,
that the target is going to want to say,
что целевой владелец захочет сказать,
but the idea is to cover all the different combinations
а просто охватить все различные сочетания
of the sounds that occur in the language.
звуков, которые существуют в языке.
The more speech you have,
Чем больше речевой информации у вас есть,
00:06:49
the better sounding voice you're going to have.
тем лучший по звучанию голос получится.
Once you have those recordings,
Как только такие записи созданы,
what we need to do
следующее, что нужно сделать,
is we have to parse these recordings
это разобрать эти записи
Для просмотра параллельного текста полностью залогиньтесь или зарегистрируйтесь
←предыдущая следующая→ ...