StudyEnglishWords

4#

Как найти худшее место для парковки в Нью-Йорке, оперируя данными. Ben Wellington - видеоролик

Изучайте английский язык с помощью параллельных субтитров ролика "Как найти худшее место для парковки в Нью-Йорке, оперируя данными". Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь. Всего 353 книги и 1726 познавательных видеороликов в бесплатном доступе.

страница 4 из 8  ←предыдущая следующая→ ...

00:04:44
It's called the NYPD Crash Data Band-Aid,
and it goes to the NYPD's website and it would download PDFs.
Он назвал её NYPD Crash Data Band-Aid,
она заходила на сайт Департамента полиции и скачивала PDF-файлы.
Every day it would search; if it found a PDF, it would download it
Каждый день она искала PDF-файлы и, если находила, скачивала их,
and then it would run some PDF-scraping program,
а затем запускала программу разбора PDF,
and out would come the text,
извлекала текст,
and it would go on the Internet, and then people could make maps like that.
загружала данные в Интернет, и в итоге люди могли делать подобные карты.
00:05:00
And the fact that the data's here, the fact that we have access to it --
И то, что у нас есть эти данные, что мы можем работать с ними...
Every accident, by the way, is a row in this table.
Кстати, каждое ДТП — строка в этой таблице.
You can imagine how many PDFs that is.
Представьте, сколько это PDF-файлов.
The fact that we have access to that is great,
У нас есть доступ к данным — это отлично,
but let's not release it in PDF form,
но не нужно публиковать их в формате PDF
00:05:12
because then we're having our citizens write PDF scrapers.
и заставлять горожан писать программы разбора PDF-файлов.
It's not the best use of our citizens' time,
Это не лучший способ задействовать горожан,
and we as a city can do better than that.
и мы, как город, можем улучшить ситуацию.
Now, the good news is that the de Blasio administration
actually recently released this data a few months ago,
Есть и хорошая новость — администрация де Блазио
недавно опубликовала эти данные, несколько месяцев назад,
and so now we can actually have access to it,
и теперь у нас есть нормальный доступ к ним,
00:05:26
but there's a lot of data still entombed in PDF.
но множество данных по-прежнему сокрыто в PDF-файлах.
For example, our crime data is still only available in PDF.
Например, данные по преступности доступны только в формате PDF.
And not just our crime data, our own city budget.
И не только. Даже бюджет города.
Our city budget is only readable right now in PDF form.
And it's not just us that can't analyze it --
Бюджет города доступен только в формате PDF.
И не только мы с вами не можем проанализировать его,
our own legislators who vote for the budget
но и сами законодатели, которые голосуют за бюджет,
00:05:44
also only get it in PDF.
тоже получают его только в формате PDF.
So our legislators cannot analyze the budget that they are voting for.
Законодатели не могут проанализировать бюджет, за который голосуют.
And I think as a city we can do a little better than that as well.
И я думаю, что мы можем организовать всё гораздо лучше.
Now, there's a lot of data that's not hidden in PDFs.
Есть множество данных, не похороненных в PDF-файлах.
This is an example of a map I made,
Вот ещё одна из таких карт —
00:05:58
and this is the dirtiest waterways in New York City.
Now, how do I measure dirty?
самая грязная вода в Нью-Йорке.
Как измерить загрязнённость воды?
Well, it's kind of a little weird,
Это покажется немного странным,
but I looked at the level of fecal coliform,
но я смотрел на уровень фекальных бактерий,
which is a measurement of fecal matter in each of our waterways.
который по сути отражает количество экскрементов в воде.
The larger the circle, the dirtier the water,
Чем больше круг, тем грязнее вода,
скачать в HTML/PDF
share