StudyEnglishWords

4#

Что мы узнали из 5 миллионов книг - видеоролик

Изучайте английский язык с помощью параллельных субтитров ролика "Что мы узнали из 5 миллионов книг". Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь. Всего 299 книг и 1682 познавательных видеоролика в бесплатном доступе.

страница 6 из 8  ←предыдущая следующая→ ...

00:10:15
and their fame after.
и славы после.
So that's sort of what we expect.
Это то, что мы ожидаем.
And we compare that to the fame that we observe.
И мы сравним это с тем, что мы наблюдаем.
And we just divide one by the other
Затем делим одно на второе,
to produce something we call a suppression index.
чтобы получить что-то, называемое индекс подавления.
00:10:26
If the suppression index is very, very, very small,
Если индекс подавления очень, очень, очень маленький,
then you very well might be being suppressed.
вероятно, что вас действительно подавляют.
If it's very large, maybe you're benefiting from propaganda.
Если он очень велик, наверное, вас пропагандируют.
JM: Now you can actually look at
ЖМ: Теперь можно посмотреть
the distribution of suppression indexes over whole populations.
на распределение индексов подавления по всёму населению.
00:10:40
So for instance, here --
Например, здесь:
this suppression index is for 5,000 people
это индекс подавления для 5 тысяч людей,
picked in English books where there's no known suppression --
взятых из английских книг, где известно про отсутствие цензуры,
it would be like this, basically tightly centered on one.
он примерно вот такой, сконцентрированный возле единицы.
What you expect is basically what you observe.
Ожидаемое совпадает с наблюдаемым.
00:10:50
This is distribution as seen in Germany --
Это распределение наблюдалось в Германии —
very different, it's shifted to the left.
оно совершенно другое, смещено влево.
People talked about it twice less as it should have been.
Люди говорили об этом в два раза реже, чем должны были.
But much more importantly, the distribution is much wider.
Однако, что более важно, распределение намного шире.
There are many people who end up on the far left on this distribution
О многих людях, которые оказываются на левом краю этого распределения,
00:11:02
who are talked about 10 times fewer than they should have been.
говорят в 10 раз меньше, чем должны.
But then also many people on the far right
Однако многие люди на правом краю
who seem to benefit from propaganda.
пожинают плоды пропаганды.
This picture is the hallmark of censorship in the book record.
Эта картинка — клеймо цензуры на книжной истории.
ELA: So culturomics
ЭЛА: Мы называем этот метод
00:11:14
is what we call this method.
культуромикой.
It's kind of like genomics.
Это как геномика.
Except genomics is a lens on biology
Разве что геномика это линза для биологии,
through the window of the sequence of bases in the human genome.
взгляд сквозь окно последовательностей оснований генома человека.
Culturomics is similar.
Культуромика сходна.
00:11:25
It's the application of massive-scale data collection analysis
Это применение анализа наборов данных огромного масштаба
to the study of human culture.
к изучению человеческой культуры.
Here, instead of through the lens of a genome,
Но взамен линзы генома,
through the lens of digitized pieces of the historical record.
мы смотрим сквозь линзу оцифрованных частиц истории.
The great thing about culturomics
Замечательным аспектом культуромики является то,
00:11:37
is that everyone can do it.
что любой может ею заняться.
Why can everyone do it?
Почему же любой может ею заняться?
Everyone can do it because three guys,
Потому что эти парни,
Jon Orwant, Matt Gray and Will Brockman over at Google,
Джон Орвант, Мэтт Грей и Уилл Брокман из Google,
saw the prototype of the Ngram Viewer,
увидев прототип средства просмотра N-грамм,
00:11:48
and they said, "This is so fun.
сказали: «Это очень весёлая вещь.
We have to make this available for people."
Давайте это опубликуем».
So in two weeks flat -- the two weeks before our paper came out --
Ровно за две недели — за две недели до публикации нашей статьи —
they coded up a version of the Ngram Viewer for the general public.
они запрограммировали публичную версию средства просмотра N-грамм.
скачать в HTML/PDF
share