Решение N-Tech.Lab стало лидером мирового чемпионата по распознаванию лиц The MegaFace Benchmark
The MegaFace Benchmark, мировой чемпионат, организованный Университетом Вашингтона, - это первое соревнование по распознаванию лиц на больших базах фотографий до миллиона изображений. Ранее решения проверялись на базах порядка 10 тыс. фотографий. Решение N-Tech.Lab, российского стартапа, который разрабатывает алгоритмы искусственного интеллекта на базе нейронных сетей, оказалось наиболее эффективным из более 100 решений, участвовавших в чемпионате — точность распознавания составила более 73,3%!
10 января 2016
На рис. - Пример проекции представлений лиц на плоскость. При этом расстояния являются мерой сходства фотографий. На рисунке хорошо заметно, что фотографии одного человека склонны группироваться в кластер, фотографии так же группируются в зависимости от пола, возраста и других атрибутов лица.
Важным преимуществом алгоритма N-Tech.Lab являются невысокие требования к мощностям компьютеров. Для обучения алгоритма компания использовала два ПК на базе 4 графических процессоров NVIDIA GeForce GTX 980 и один ПК на базе 4х карт NVIDIA GeForce GTX Titan Black.
Созданная NVIDIA технология CUDA (Сompute Unified Device Architecture — программно-аппаратная архитектура массивно параллельных вычислений) позволяет решать большую часть вычислительных задач эффективнее, чем при использовании ресурсов CPU. N-Tech.Lab использовала для обучения нейронных сетей NVIDIA cuDNN 3 – актуальную версию GPU-ускоренной библиотеки математических операций для глубоких нейронных сетей, которую разработчики встраивают во фреймворки машинного обучения высокого уровня. . Библиотека обеспечивает высокую производительность и низкую нагрузку на память. Простота использования позволяет разработчикам сконцентрироваться на проектировании и реализации моделей нейронных сетей, а не на подстройке производительности, при этом они получают максимально высокую производительность параллельных вычислений.
N-Tech.Lab намерена совершенствовать созданный компанией алгоритм, в том числе и за счет расширения сотрудничества с NVIDIA– одним из мировых лидеров в области высокопроизводительных вычислений. Решения NVIDIA используются по всему миру, в том числе крупными ИТ и Интернет-компаниями, например Google, Yandex и Facebook. Также среди компаний, использующих GPU-решения NVIDIA— крупнейшие игроки рынка биотехнологий, нефтяные и промышленные компании, оборонные предприятия, производители пищевых продуктов и т. д.
«С помощью больших вычислительных систем на базе GPU мы сможем сделать наш алгоритм еще более эффективным и достичь еще большей точности распознавания. Уже сейчас точность нашего алгоритма намного выше точности распознавания человеком. Например, при работе с базами объемом до 10 тысяч фотографий средняя точность распознавания человеком составляет 25%, наш алгоритм дает точность 90%. После того как нейронная сеть обучена, на одном GPU, она способна обрабатывать до 100 фотографий в секунду, этого достаточно для решения большинства практических задач», - отмечает основатель N-tech.Lab Артём Кухаренко.
N-tech.Lab также активно работает над созданием на базе своего алгоритма новых сервисов. Компания готовится запустить несколько коммерческих продуктов с использованием созданного решения. Один из них — сервис знакомств, позволяющий искать людей с внешностью определенного типа. Пользователь сервиса сможет загрузить фотографию понравившегося человека и найти его или похожих на него людей в соцсетях. В настоящий момент ведется разработка подобного приложения.
Другая сфера применения разработанной технологии — адресная реклама в ритейле. Алгоритм может анализировать записи с камер наблюдения в интернет-магазинах и искать посетителей в социальных сетях. После этого потенциальному покупателю можно направлять адресную рекламу. В настоящий момент N-tech.Lab ведет переговоры с несколькими крупными ритейлерами о создании подобных решений.
Также решение, созданное N-tech.Lab, может использоваться в новых моделях смартфонов для создания приложений, обеспечивающих авторизацию пользователя по фотографии. Также подобный алгоритм может анализировать записи с камер, вмонтированных в банкоматы и установленных в отделениях банков для отслеживания потенциальных мошенников и оперативного оповещения об опасности.
Еще одна возможная сфера применения — решения в области безопасности. Сейчас камеры наблюдения устанавливаются практически во всех общественных местах — в метро, торговых центрах, на улицах, вокзалах и аэропортах. Основная сложность в подобных решениях — быстро выделять лица, отмеченные в базе данных из постоянного потока людей. Созданное N-Tech.Lab решение обеспечивает достаточную скорость для решения задач по обеспечению безопасности практически любой сложности.
Важным преимуществом алгоритма N-Tech.Lab являются невысокие требования к мощностям компьютеров. Для обучения алгоритма компания использовала два ПК на базе 4 графических процессоров NVIDIA GeForce GTX 980 и один ПК на базе 4х карт NVIDIA GeForce GTX Titan Black.
Созданная NVIDIA технология CUDA (Сompute Unified Device Architecture — программно-аппаратная архитектура массивно параллельных вычислений) позволяет решать большую часть вычислительных задач эффективнее, чем при использовании ресурсов CPU. N-Tech.Lab использовала для обучения нейронных сетей NVIDIA cuDNN 3 – актуальную версию GPU-ускоренной библиотеки математических операций для глубоких нейронных сетей, которую разработчики встраивают во фреймворки машинного обучения высокого уровня. . Библиотека обеспечивает высокую производительность и низкую нагрузку на память. Простота использования позволяет разработчикам сконцентрироваться на проектировании и реализации моделей нейронных сетей, а не на подстройке производительности, при этом они получают максимально высокую производительность параллельных вычислений.
N-Tech.Lab намерена совершенствовать созданный компанией алгоритм, в том числе и за счет расширения сотрудничества с NVIDIA– одним из мировых лидеров в области высокопроизводительных вычислений. Решения NVIDIA используются по всему миру, в том числе крупными ИТ и Интернет-компаниями, например Google, Yandex и Facebook. Также среди компаний, использующих GPU-решения NVIDIA— крупнейшие игроки рынка биотехнологий, нефтяные и промышленные компании, оборонные предприятия, производители пищевых продуктов и т. д.
«С помощью больших вычислительных систем на базе GPU мы сможем сделать наш алгоритм еще более эффективным и достичь еще большей точности распознавания. Уже сейчас точность нашего алгоритма намного выше точности распознавания человеком. Например, при работе с базами объемом до 10 тысяч фотографий средняя точность распознавания человеком составляет 25%, наш алгоритм дает точность 90%. После того как нейронная сеть обучена, на одном GPU, она способна обрабатывать до 100 фотографий в секунду, этого достаточно для решения большинства практических задач», - отмечает основатель N-tech.Lab Артём Кухаренко.
N-tech.Lab также активно работает над созданием на базе своего алгоритма новых сервисов. Компания готовится запустить несколько коммерческих продуктов с использованием созданного решения. Один из них — сервис знакомств, позволяющий искать людей с внешностью определенного типа. Пользователь сервиса сможет загрузить фотографию понравившегося человека и найти его или похожих на него людей в соцсетях. В настоящий момент ведется разработка подобного приложения.
Другая сфера применения разработанной технологии — адресная реклама в ритейле. Алгоритм может анализировать записи с камер наблюдения в интернет-магазинах и искать посетителей в социальных сетях. После этого потенциальному покупателю можно направлять адресную рекламу. В настоящий момент N-tech.Lab ведет переговоры с несколькими крупными ритейлерами о создании подобных решений.
Также решение, созданное N-tech.Lab, может использоваться в новых моделях смартфонов для создания приложений, обеспечивающих авторизацию пользователя по фотографии. Также подобный алгоритм может анализировать записи с камер, вмонтированных в банкоматы и установленных в отделениях банков для отслеживания потенциальных мошенников и оперативного оповещения об опасности.
Еще одна возможная сфера применения — решения в области безопасности. Сейчас камеры наблюдения устанавливаются практически во всех общественных местах — в метро, торговых центрах, на улицах, вокзалах и аэропортах. Основная сложность в подобных решениях — быстро выделять лица, отмеченные в базе данных из постоянного потока людей. Созданное N-Tech.Lab решение обеспечивает достаточную скорость для решения задач по обеспечению безопасности практически любой сложности.