ChatGPT вече може да говори като човек (видео)
GPT-4о е способен на разговори, които включват текст, аудио и видео в реално време
OpenAI обяви мащабно обновление на своя чатбот GPT-4. Модернизираният ChatGPT-4о е способен да води аудио и видео разговори в реално време. Освен това изкуственият интелект говори с интонации и формулировки, които предават силно чувство за емоция и самоличност, пише NewScientist.
Говорейки с женски глас и отговаряйки на името ChatGPT, възможностите за разговор на новия AI напомнят на научнофантастичния филм Her от 2013 г. От OpenAI са се постарали чатботът им да не дава роботизирани отговори, като типичните досега гласови асистенти.
"Новото взаимодействие на GPT-4o тип "глас към глас" е по-тясно паралелно на взаимодействието човек-човек", казва Мишел Кон от Калифорнийския университет в Дейвис. "Голяма част от това се дължи на липсата на съществено забавяне и на емоционална изразителност, което генерира гласът."
"Уау, по-бавно, ти не си прахосмукачка", коментира GPT-4o учестеното дишане на Марк Чен от OpenAI. По този начин изкуственият интелект демонстрира, че познава ежедневната реч на хората.
AI също визуално прегледа рисунка от Барет Зоф от OpenAI, която включваше думи и сърце.
"О, виждам, че сте написали, че обичате ChatGPT, това е толкова мило от ваша страна", коментира алгоритъмът.
Новият ChatGPT също устно инструктира своите събеседници за решаване на просто линейно уравнение, обясни функцията на компютърния код и интерпретира диаграма, показваща температурни линии, достигащи пик през летните месеци.
Новият гласов режим първо ще стане достъпен за платени абонати на ChatGPT Plus през следващите седмици, каза Сам Алтман, главен изпълнителен директор на OpenAI.
От компанията обещават технологията в крайна сметка да стане достъпна и за безплатните абонати. Тя обаче крие нови рискове за безопасността поради начина, по който включва и интерпретира информация в реално време. От OpenAI заявяват, че "работят за смекчаване на последствията от възможните недоброжелателни употреби на алгоритъма".
"Провеждането на безпроблемни мултимодални разговори е наистина трудно, така че демонстрациите са впечатляващи", казва Питър Хендерсън от Принстънския университет в Ню Джърси.
Хендерсън каза, че е "любопитен" да види условията за поверителност на OpenAI, след като потребителите на ChatGPT започнат да споделят свое аудио и видео на живо, и дали безплатните потребители могат да се откажат от събирането на данни, което може да се използва за обучение на бъдещи модели на OpenAI.
"Моделът изглежда се хоства извън устройството, фактът, че можете да споделяте екрана на работния си плот с алгоритъма през интернет или непрекъснато да записвате аудио или видео", коментира Хендерсън. Това създава повишени рискове за личните данни на потребителите.
Най-голямата заплаха с новия ChatGPT-4о е свързана с потенциала му за използване от "ало-измамници", както и употребата от недоброжелателни хора с цел внушения и манипулации.