Распознавание лиц

Материал из Posmotreli
Перейти к навигации Перейти к поиску
Как это работает на самом деле

(link)

Простенькая версия подобной программы, встроенная прямо в камеру и работающая в реальном времени.

Когда киношной полиции удается достать фото или видео с изображение преступника, дело практически раскрыто — остается только запустить программу распознавания лиц, которая, десять секунд помигав случайными фото[1], расторопно выведет на экран всю информацию о преступнике, добытую из магической базы данных. При этом, программа никогда не ошибается и всегда выдаёт абсолютно точный результат. Более того, ни в одной полицейской драме никто никогда даже не предполагает, что программа может ошибиться.

Ещё в начале 2010-х распознавание лиц считалось глупым штампом дешёвых детективных сериалов. И даже через 5 лет, когда писалась эта статья, многие думали, что до широкого применения подобной технологии ещё очень далеко. Но как выяснилось, прогресс на стоит на месте, и сейчас подобные программы уже встраиваются даже в смартфоны и интернет-поисковики (просто попробуйте загрузить чьё-нибудь лицо в Яндекс. Картинки).

Теперь же данный троп подпадает под датировку по электронике, ведь в кино подобные программы почему-то тратят очень много времени на поиск совпадений (в реальности на это уходят доли секунды), и искать почему-то могут только по статичному изображению (а не в реальном времени прямо с камеры наблюдения, заботливо обводя лицо в квадратик и указывая рядом имя, пол и возраст).

В реальной жизни[править]

Почему же ещё совсем недавно распознавание лиц считалось нереалистичным? Дело в том, что сама задача распознавания практически не формализуема, многомерна и основана на нечёткой логике. Эти три качества очень затрудняют её решение классическими алгоритмическими методами. Зато как нельзя лучше подходит для нейросетей, которые как раз умеют выделять на изображении те или иные паттерны, даже учитывая разный ракурс, шумы и т. д. Но ведь первые реализации искусственных нейросетей датируются уже концом 50-х, и тогда казалось вот-вот… Но проходили годы, «вот-вот» всё никак не наступал: имеющееся тогда «железо» было либо слишком слабым, либо просто не подходило для реализации нейронок, а делать что-то специально никто не стал бы, потому что дорого, а результат не гарантирован. Наступила так называемая «зима ИИ», отголоски которой не утихали ещё какое-то время после получения практических результатов. Посмотрите на историю этой статьи: уже в 2019 году, когда реальность распознавания лиц уже нельзя было отрицать, здесь всё ещё фигурировало слово «нереалистично»

Как же работают современные системы распознавания лиц? Как уже писалось выше, сравнивают определённые паттерны на изображениях. Что это конкретно за паттерны, иногда не знают даже сами создатели программы, ведь нейронная сеть создаёт их себе сама во время обучения на миллионах изображений. Поэтому крайне важно, чтобы обучающая выборка была максимально репрезентативной, иначе программа получится предвзятой (например, если вы будете обучать её только на фотографиях белых людей, то у неё закономерно возникнут серьёзные проблемы с чернокожими). Зато если всё сделано правильно, то программа будет определять похожие лица на фотографиях с почти человеческой точностью.

Разумеется, подобные программы не идеальны, и не исключены ложные срабатывания. Однако прелесть нейронных сетей в том, что выдаваемый ими результат это не просто «да/нет», а набор вероятностей того, что, по мнению программы, изображено на картинке. Так что если есть несколько людей с очень похожими лицами, то программа покажет их всех, что хоть и не позволит сразу же определить преступника, но зато поможет очень сильно сузить круг подозреваемых. Также нейронную сеть пока ещё можно обмануть, закрыв достаточную часть лица (например, большими чёрными очками, а вот накладной бородой систему, которую обучали на примерах, где один и тот же человек, то с бородой, то без бороды не обмануть), но эта проблема временная, скорее всего вслед за распознаванием по лицу появятся системы распознавания по жестикуляции, походке и т. д. — по крайней мере уже есть распознавание по задницам.

Что касается базы данных, то с появлением социальных сетей выяснилось, что заводить на каждого подробное досье не обязательно, ведь люди сами заботливо выкладывают свои фотографии в открытый доступ, снабжая их всей подробной информацией о себе. А если человек не делает это сам, то это наверняка делает кто-то из его друзей или родственников. Более того, многие соглашаются загрузить своё лицо и в конкретную базу данных, ведь так удобно разблокировать смартфон и оплачивать покупки, просто посмотрев в камеру! К тому же, если вы авторитарное государство, то у них может и не быть выбора.

При этом, одним только поиском похожих лиц нейронные сети не ограничены. Уже сейчас они могут распознать по вашему лицу ваш приблизительный возраст и пол, а в обозримом будущем будут точно определять ваши эмоции и читать по губам то, что бы говорите. Распознать они могут и вашу одежду, ваши движения и жесты, а также то, что вы держите в руках. Причём делается это всё в реальном времени, так что в будущем камеры смогут вызывать полицию (или госбезопасность) сразу же как только увидят кого-то подозрительного. А ведь эту технологию планируют использовать ещё и в военных целях…

Конечно же, далеко не всем хочется появления Большого Брата в реальной жизни, поэтому сейчас очень многие выступают за запрет использования систем распознавания лиц как государством, так и частными компаниями. В некоторых местах их уже запрещают. А вот в некоторых наоборот — крайне активно внедряют. Особенно сильно эта технология понравилась Китаю, и то, когда другие страны начнут брать с него пример, является лишь вопросом времени. Сейчас искусственные нейронные сети развиваются семимильными шагами, поэтому 2020-е обещают быть весьма интересными.

Где встречается[править]

Литература[править]

  • Г. Гаррисон, «Стальная Крыса» — в начале повести протагонист проходит под камерой и подсвечивает, что если его изменённая внешность будет похожа на фото из полицейской базы данных, то его сцапают на месте. В других повестях подобные системы упоминаются, но редко. Можно обосновать тем, что Галактическая Лига находится в состоянии, подобном Империуму: на разных планетах совершенно разный технологический уровень, и далеко не везде такую систему технически возможно создать.
  • «Меганезия» — у каждого меганезийского полицейского на груди висит камера, соединённая с базой данных, и стоит только в толпе мелькнуть объявленному в розыск подозреваемому, сотрудник полиции получит сигнал. В базу также вносятся различные недоброжелатели Меганезии, которые могут попытаться проникнуть в неё инкогнито. Но в целом, конкретно эта технология и ее возможные применения в серии особо не выделяется.

Фанфики[править]

  • «Санитары Подземелий» Гоблина — здесь опознают по форме черепа.

Кино[править]

  • «Форсаж 5» — именно подобная программа опознала героев по линии глаз.
  • «Копы в глубоком запасе» — пародия: программа, разработанная одним из главных героев, способна узнавать лицо человека по его затылку.

Телесериалы[править]

  • «След». Замечено неоднократно.
  • «ОСА», Особая Следственная Аналитика. «След» в режиме «педаль в пол». Продвинутый искусственный интеллект там уже за гранью фантастики, распознает и вычисляет всё и вся. Но ассасин человек в капюшоне сумел от них ускользнуть.
  • «Кости» — Энджелатрон умеет и не такое. В поздних сезонах в случаях, когда требуется вдавить педаль в костный мозг, достаточно черепа, который склеили из осколков, чтобы запустить распознавание по базе водительских удостоверений.
  • Supernatural — в конце 14-го сезона для того, чтобы найти сбежавшего Джека, братья Винчестеры пришли в центр распознавания лиц, где быстро нашли его по данных с множества камер наблюдения. Однако это оказалось бесполезным, так как Джек постоянно телепортировался из одного место в другое.

Мультфильмы[править]

  • «Тайна Коко» — здесь систему распознавания лиц используют в мире мёртвых, чтобы определить, выставил ли кто-то фотографию умершего на День Мёртвых, и, соответственно, пропустить его в мир живых.

Мультсериалы[править]

  • «Человек-Паук 1994», серия «Крик Стервятника» — Человек-Паук сумел сфотографировать Стервятника и загрузил фотографию в систему распознавания лиц, чтобы попытаться установить его личность. Программа сразу выдала предупреждение о погрешности не менее тридцати процентов, а сравнения проводила с различными известными людьми, среди которых были деятели шоу-бизнеса, ученые, политики, бизнесмены и преступники. Тумза система опознала, но Пауку это помогло мало. Ни в одной другой серии эта программа не использовалась.

Аниме[править]

  • GITS — практически кодификатор. Тут лица не просто распознаются, с воссозданием из изображения с камеры наблюдения низкополигонального паттерна. Местами мелькает магия с «разворотом в анфас» этого снятого паттерна с открытием невидимого с камеры уха или ещё какой части головы.

Прочее[править]

  • Существует замечательная программа Picasa (к сожалению, Google уже прекратил её поддержку), имеющая на борту, кроме огромного количества инструментов для редактирования, ещё и модуль распознания лиц, который позволяет, после соответствующих настроек, найти все фотографии с конкретным человеком на данной машине. Возрастные изменения лиц для неё не проблема, с фотографией студенческих лет она безошибочно может сопоставить фотографию этого же человека времён начальной школы. Освещение и размытость фотографии обычно также не являются проблемой. Спорный (плюс или минус — кому как) момент — может путать родственников и просто похожих людей, хотя в большинстве случаев это даётся в качестве предположения, что возможно на фотографии этот человек (есть двух степеней: либо сразу предлагает подтвердить он это или нет, либо при попытке внести в базу нового человека предлагает варианты, кто это может быть).

Где НЕ встречается[править]

Литература[править]

  • В. Богомолов, «В августе сорок четвёртого» — разумеется, никаких баз данных с фотографиями не было. Капитан Алёхин просто запомнил наизусть десятки ориентировок на вражеских агентов и опознает главгада по словесному портрету.

Телесериалы[править]

  • «Братаны», четвёртый сезон, вторая арка («Прощание»), где убивают Сережу Евликина, а братаны долго — и поначалу тщетно — ищут сообщников его убийцы. Внезапно — аверсия:
« Старый: Слушай, а нельзя ли фотографию в компьютер загрузить — и найти человека?
Макар (с едва уловимой иронией): Можно. (После крохотной паузы, мрачно) В кино.
»
— «Братаны»
  • «Грань» — в четвёртом сезоне Оливия долго пытается найти в базах Питера Бишопа по собственноручно нарисованному портрету, но это ей так и не удаётся.
  • «Детективы». Детективы действуют по старинке (весьма реалистично). Самая надежная база — личные связи старших детективов с местными представителями правопорядка и общедоступная информация вроде криминальных сводок, а лица они распознают исключительно своими глазами.
  • «Тайны следствия». Кое-какая база фотографий есть, но никто их не распознает. Фигурантов дел ищут своими силами.
  • «Каменская». Она доходит до решения своими мозгами. Аналитик потому что.
  • «Улицы разбитых фонарей». В некоторых сериях встречается очевидный хайтековский абсурд (самопародия), но в целом никаких волшебных баз нет. Верят только своим глазам.
  • «Касл» — когда Беккет решает проверить неизвестного человека в списке пропавших, то Касл ожидает нечто по штампу, однако его ожидает старенькая картотека с папками.
    • А вот начиная с третьего сезона — уже полноценный сабж. Сначала такой программой пользовались спецагенты (сезон 3, эпизод 9), но после появления Тори Эллис в пятом сезоне — уже и сами полицейские.
  1. Зачем листать по экрану фото — вообще непонятно, любая визуальщина, даже простейший прогрессбар, тут же сказывается на быстродействии. Но зрителю нравится — видно, что машинка работает.