StudyEnglishWords

4#

Что мы узнали из 5 миллионов книг - видеоролик

Изучайте английский язык с помощью параллельных субтитров ролика "Что мы узнали из 5 миллионов книг". Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь. Всего 353 книги и 1726 познавательных видеороликов в бесплатном доступе.

страница 3 из 8  ←предыдущая следующая→ ...

00:04:17
We're going to tell you how many times a particular four-gram
Мы скажем, как часто именно эта 4-грамма
appeared in books in 1801, 1802, 1803,
появлялась в книгах в 1801-м, 1802-м, 1803-м,
all the way up to 2008.
и так далее вплоть до 2008-го.
That gives us a time series
Это даст временной ряд частоты использования
of how frequently this particular sentence was used over time.
именно этой фразы с течением времени.
00:04:27
We do that for all the words and phrases that appear in those books,
Мы проделываем это для всех слов и фраз, появляющихся в этих книгах,
and that gives us a big table of two billion lines
и это даёт большую таблицу в два миллиарда строк,
that tell us about the way culture has been changing.
которые говорят нам, каким образом изменялась культура.
ELA: So those two billion lines,
ЭЛА: Эти два миллиарда строк,
we call them two billion n-grams.
мы называем их два миллиарда N-грамм.
00:04:39
What do they tell us?
Что они нам говорят?
Well the individual n-grams measure cultural trends.
Отдельные N-граммы измеряют культурные тенденции.
Let me give you an example.
Позвольте привести пример.
Let's suppose that I am thriving,
Предположим, я процветаю сегодня,
then tomorrow I want to tell you about how well I did.
и завтра хочу рассказать вам, как мне было хорошо.
00:04:49
And so I might say, "Yesterday, I throve."
Я могу сказать: «Вчера я процветал [throve]».
Alternatively, I could say, "Yesterday, I thrived."
По-другому, я могу сказать: «Вчера я процветал [thrived]».
Well which one should I use?
Какой вариант мне использовать?
How to know?
Как узнать?
As of about six months ago,
Примерно шесть месяцев назад,
00:05:02
the state of the art in this field
положение дел в этой области
is that you would, for instance,
было таким, что можно было, например,
go up to the following psychologist with fabulous hair,
подойти к психологу с поразительной стрижкой
and you'd say,
и спросить:
"Steve, you're an expert on the irregular verbs.
«Стив, ты эксперт по неправильным глаголам.
00:05:13
What should I do?"
Как мне быть?»
And he'd tell you, "Well most people say thrived,
А он бы ответил: «Большая часть людей сказала бы процветал [thrive],
but some people say throve."
но некоторые скажут процветал [throve]».
And you also knew, more or less,
Как известно, более или менее,
that if you were to go back in time 200 years
если вернуться на 200 лет назад,
00:05:25
and ask the following statesman with equally fabulous hair,
и спросить вот этого политика, с не менее поразительной стрижкой,
(Laughter)
(Смех)
"Tom, what should I say?"
«Том, как нужно говорить?»
He'd say, "Well, in my day, most people throve,
Он бы ответил: «В мои дни большая часть людей процветала [throve],
but some thrived."
но некоторые процветали [thrived]».
00:05:38
So now what I'm just going to show you is raw data.
Я вам покажу необработанные данные.
Two rows from this table of two billion entries.
Две строки из таблицы в два миллиарда строк.
What you're seeing is year by year frequency
Здесь показана, год за годом,
of "thrived" and "throve" over time.
частота слов «процветал [thrived]» и «процветал [throve]».
Now this is just two
И это всего лишь два
00:05:52
out of two billion rows.
из двух миллиардов строк.
So the entire data set
Весь набор данных
is a billion times more awesome than this slide.
в миллиард раз круче, чем этот слайд.
(Laughter)
(Смех)
(Applause)
(Аплодисменты)
00:06:06
JM: Now there are many other pictures that are worth 500 billion words.
ЖМ: Есть много других картинок, которые стоят 500 миллиардов слов.
For instance, this one.
Например, вот эта.
If you just take influenza,
Если взять грипп,
you will see peaks at the time where you knew
можно видеть пики в то время,
скачать в HTML/PDF
share