Как компьютер умеет мгновенно распознавать объекты. Joseph Redmon - видеоролик

Изучение английского языка с помощью параллельных субтитров ролика "Как компьютер умеет мгновенно распознавать объекты". Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь. Всего 828 книг и 2809 познавательных видеороликов в бесплатном доступе.

Десять лет назад исследователи считали, что создать компьютер, который сможет отличить кошку от собаки, практически невозможно. Сегодня система компьютерного зрения способна определить это почти со стопроцентной точностью. Как? Джозеф Рэдмон работает над YOLO (Смотри только один раз) — системой с открытым исходным кодом, которая способна опознавать объекты и идентифицировать их в изображениях и видео — от зебры до знаков «Стоп» — с молниеносной скоростью. В замечательном демо-ролике Рэдмон демонстрирует этот важный шаг в разработке приложений для самоуправляемых автомобилей, робототехники и даже для диагностики рака.

смотреть видеоролик

скрыть русский текст

страница 1 из 3 ←предыдущая следующая→ ...

00:00:00

Ten years ago,

Десять лет назад

computer vision researchers thought that getting a computer

исследователи компьютерного зрения думали, что научить компьютер

to tell the difference between a cat and a dog

различать изображения кошки и собаки

would be almost impossible,

будет практически невозможно,

even with the significant advance in the state of artificial intelligence.

даже несмотря на значительный прогресс в развитии искусственного интеллекта.

00:00:13

Now we can do it at a level greater than 99 percent accuracy.

Сегодня мы можем это делать с точностью до 99 процентов.

This is called image classification --

Это называется классификацией изображений,

give it an image, put a label to that image --

дайте компьютеру картинку, присвойте этой картинке категорию,

and computers know thousands of other categories as well.

и он выдаст вам тысячи похожих.

I'm a graduate student at the University of Washington,

Я аспирант в Вашингтонском университете,

00:00:29

and I work on a project called Darknet,

работаю над проектом Darknet,

which is a neural network framework

который представляет собой нейронную сеть

for training and testing computer vision models.

для обучения и тестирования модели компьютерного зрения.

So let's just see what Darknet thinks

Давайте посмотрим, что думает Darknet

of this image that we have.

о данном изображении.

00:00:42

When we run our classifier

Когда мы запускаем наш классификатор

on this image,

для этого изображения, мы видим,

we see we don't just get a prediction of dog or cat,

что мы не просто получаем предположение, собака здесь изображена или кошка,

we actually get specific breed predictions.
That's the level of granularity we have now.

мы фактически получаем варианты конкретных пород.

And it's correct.

Вот современный уровень детализации.
И он не ошибся.

00:00:54

My dog is in fact a malamute.

Порода моей собаки действительно маламут.

So we've made amazing strides in image classification,

Поэтому мы сделали удивительные успехи в классификации изображений,

but what happens when we run our classifier

но что происходит, когда мы запускаем наш классификатор

on an image that looks like this?

применительно к картинке, которая выглядит вот так?

Well ...

Ну...

00:01:12

We see that the classifier comes back with a pretty similar prediction.

Мы видим, что классификатор выдаёт довольно похожие варианты.

And it's correct, there is a malamute in the image,

Всё правильно: на фото — маламут,

but just given this label, we don't actually know that much

но по одной такой метке мы на самом деле не знаем,

about what's going on in the image.

что происходит на снимке.

We need something more powerful.

Нам нужно нечто более мощное.

00:01:27

I work on a problem called object detection,

Я работаю над вопросом, касающимся обнаружения объекта,

where we look at an image and try to find all of the objects,

то есть, когда мы смотрим на фото и пытаемся найти все объекты,

put bounding boxes around them

ставим ограничивающие прямоугольники вокруг них

and say what those objects are.

и определяем эти объекты.

So here's what happens when we run a detector on this image.

Вот что происходит, когда мы запускаем детектор на этом изображении.

00:01:41

Now, with this kind of result,

И теперь, имея такой результат,

we can do a lot more with our computer vision algorithms.

мы можем сделать гораздо больше с нашими алгоритмами компьютерного зрения.

We see that it knows that there's a cat and a dog.

Мы видим, что компьютер знает, где кошка, а где собака.

It knows their relative locations,

Он знает их расположение относительно друг друга,

their size.

их размер.

00:01:52

It may even know some extra information.

Он даже может знать какую-то дополнительную информацию.

There's a book sitting in the background.

На заднем плане находится книга.

And if you want to build a system on top of computer vision,

И если вы хотите построить сверхсистему компьютерного зрения,

say a self-driving vehicle or a robotic system,

например, самоуправляемое транспортное средство или робототехническую систему,

Для просмотра параллельного текста полностью залогиньтесь или зарегистрируйтесь

скачать в HTML/PDF

изменить размер шрифта

←предыдущая следующая→ ...

Как компьютер умеет мгновенно распознавать объекты. Joseph Redmon - видеоролик

для печати или оффлайн чтения

для маленького экрана