ИИ от OpenAI может вычислить геолокацию по фрагментам зданий, вывескам и даже меню.
Новые модели OpenAI — o3 и o4-mini — получили возможность анализировать изображения и делать выводы о месте, где они были сняты.
Эти модели могут обрабатывать даже нечеткие и частично обрезанные фотографии, распознавая на них элементы архитектуры, надписи и другие детали.
Именно модель o3 активно используют пользователи соцсетей, чтобы определить, где сделан снимок.
Люди загружают фото зданий, улиц, ресторанных меню и даже селфи, а ИИ с высокой точностью определяет локацию. Такой функционал сравнивают с механикой онлайн-игры GeoGuessr, в которой нужно угадать место по изображениям Google Street View.
Модель может поворачивать, обрезать и масштабировать изображения, а также сопоставлять найденные детали с информацией из интернета. Например, по вывеске заведения или уникальной архитектуре она определяет конкретный город или даже заведение.
Такой тренд вызывает вопросы о конфиденциальности.
Скриншот сторис в Instagram может оказаться достаточным, чтобы установить местоположение человека.
TechCrunch протестировал модель o3 в сравнении с предыдущей версией GPT-4o, которая не умеет рассуждать на основе изображений.
В большинстве случаев GPT-4o срабатывал быстрее и точнее, но были ситуации, когда o3 оказался результативнее.
Например, он распознал бар с фиолетовой головой носорога на стене, связав его с районом Вильямсбург в Нью-Йорке, в то время как GPT-4o ошибся и предположил, что это паб в Британии.