2#

Массовое онлайн-сотрудничество. Луис фон Ан - видеоролик

Изучайте английский язык с помощью параллельных субтитров ролика "Массовое онлайн-сотрудничество". Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь. Всего 564 книги и 1815 познавательных видеороликов в бесплатном доступе.

страница 3 из 11  ←предыдущая следующая→ ...

00:03:13
Basically the way this works
Это выглядит примерно так:
is you start with an old book.
сначала есть старая книга.
You've seen those things, right? Like a book?
Видели эти штуки, верно? Ну... книги...
(Laughter)
(Смех)
So you start with a book, and then you scan it.
У нас есть книга, и мы её сканируем.
00:03:23
Now scanning a book
Сканирование книги, это как
is like taking a digital photograph of every page of the book.
фотографирование каждой страницы.
It gives you an image for every page of the book.
Мы получаем изображение каждой страницы книги.
This is an image with text for every page of the book.
Это изображение с текстом каждой страницы книги.
The next step in the process
Следующий шаг в этом процессе —
00:03:33
is that the computer needs to be able to decipher all of the words in this image.
компьютеру нужно расшифровать все слова в этом изображении.
That's using a technology called OCR,
При этом используется технология OCR,
for optical character recognition,
оптическое распознавание символов,
which takes a picture of text
которая берёт изображение текста
and tries to figure out what text is in there.
и пытается понять, что там за текст.
00:03:44
Now the problem is that OCR is not perfect.
Проблема в том, что OCR не идеальна.
Especially for older books
Особенно в старых книгах,
where the ink has faded and the pages have turned yellow,
где чернила выцвели и страницы пожелтели,
OCR cannot recognize a lot of the words.
OCR не может распознать многие слова.
For example, for things that were written more than 50 years ago,
Например, в книгах, написанных более 50 лет назад,
00:03:55
the computer cannot recognize about 30 percent of the words.
компьютер не может распознать примерно 30% слов.
So what we're doing now
Поэтому сейчас мы выбираем
is we're taking all of the words that the computer cannot recognize
все нераспознанные слова,
and we're getting people to read them for us
и даём их на чтение людям,
while they're typing a CAPTCHA on the Internet.
когда они вводят капчу в интернете.
00:04:06
So the next time you type a CAPTCHA, these words that you're typing
При следующем вводе капчи, знайте, что вы
are actually words that are coming from books that are being digitized
вводите слова, взятые из оцифровываемых книг,
that the computer could not recognize.
которые компьютер не смог распознать.
And now the reason we have two words nowadays instead of one
Мы используем два слова вместо одного,
is because, you see, one of the words
потому что одно из слов
00:04:18
is a word that the system just got out of a book,
система взяла из книги,
it didn't know what it was, and it's going to present it to you.
оно неизвестно и показывается вам.
But since it doesn't know the answer for it, it cannot grade it for you.
Однако поскольку ответ неизвестен, то оценить точность невозможно.
So what we do is we give you another word,
Поэтому мы даём другое слово,
one for which the system does know the answer.
ответ для которого известен.
00:04:30
We don't tell you which one's which, and we say, please type both.
Мы не говорим, какое из них какое, и просим ввести оба.
скачать в HTML/PDF
share