AI가 감정을 알아차릴 수 있을까요?

오픈AI의 GPT-4o 출시 소식

2024. 5. 21.

이 메일이 잘 안보이시나요?

모든 것을 담은 AI 모델

삼양인, 반가워요♥

AI와 대화를 주고받을 뿐만 아니라, 깊은 교감을 통해 사랑에 빠져버립니다.

이러한 일이 정말 가능할까요?

2014년 개봉작인 영화 <her>의 줄거리를 잠깐 이야기해 봤는데요.
이러한 영화적 상상의 일부가 이미 현실로 다가왔어요.

지난 5월 14일 발표된 ChatGPT의 새 버전,

'GPT-4o(GPT-포오)'에 대한 소식 다들 접하셨나요?

‘GPT-4o’는 생성형 AI 시장에서 게임체인저로 불릴 만큼

파격적인 진화를 선보였어요.
특히, 실제 사람이랑 대화하는 느낌을 줘서 저도 많이 놀랐습니다.

여기서 잠깐!

혹시 '나는 챗GPT를 써본 적도 없는데 또 새 버전이 나왔다고?’

라고 생각한 삼양인들 있나요?

오늘 뉴스레터를 통해 함께 차근차근 살펴봐요!

▲ 오픈 AI의 GPT-4o 시연 영상, 클릭 시 유튜브 채널로 이동

듣고 보는 능력까지 제법인걸?

GPT-4o에서 ‘o’는 ‘모든 것’을 뜻하는 단어 ‘omni(옴니)’에서 따왔는데요.

이번 버전이 일명 ‘멀티모달(Multi-Modal) AI’이기 때문이에요.

멀티모달은 텍스트, 이미지, 오디오, 비디오 등

다양한 유형의 데이터를 동시에 처리할 수 있는 능력을 말해요.

GPT-4o는 텍스트와 이미지 인식만 가능했던 기존 버전과 달리

총 50개국의 언어를 지원하며 음성과 영상까지 모두 인식해요.

질문에 반응하는 속도도 훨씬 빨라졌고요.

이전 버전들이 응답에 평균 2.8~5.4초나 걸리던 것에 비해

GPT-4o는 평균 약 0.3초로, 사람이 실제로 대화할 때와 같은 수준이에요.

속도뿐만 아니라 주고받는 대화의 흐름도 매우 자연스러워졌어요.

표정도 읽어내고 농담까지 던진다?

GPT-4o는 표정이나 목소리, 억양 등을 분석해

사용자의 감정 상태를 파악하는 모습을 보여요.

5월 14일 진행된 제품 시연회에서 미라 무라티(Mira Murati, 오픈AI CTO)와

GPT-4o와의 대화를 잠깐 살펴보자면요.

미라 무라티: “조금 긴장된 상태인데 나를 진정시켜 줄 수 있어?”

GPT-4o: ‘심호흡을 해보세요.”

(시연자의 거친 숨소리)

“오, 천천히요. 당신은 진공청소기가 아니에요.”

사용자의 숨소리를 인지하고, 어떤 감정 상태인지 분석한 뒤

농담까지 던지는 대화의 흐름이 제법 자연스럽지 않나요?

이외에도 ‘잠을 잘 자지 못하는 친구를 위해 이야기를 들려달라’고 하자,

구연동화를 읽는 톤으로 이야기를 들려주거나

종이에 수학 문제를 써서 보여준 뒤 풀어달라고 하자, 단계별 풀이도 척척 해내요.

보다 가까워진 AI

위 사진은 오픈AI가 공개한

‘내 눈이 되어주는 GPT-4o(Be My Eyes Accessibility with GPT-4o)’ 영상의 일부분이에요.

영상 속에선 GPT-4o가 시각 장애인의 택시 탑승을 돕는 장면이 나오는데요.

GPT-4o는 사용자의 카메라 렌즈를 통해 택시 한 대가 다가오는 것을 파악한 뒤,

“지금 택시가 당신의 왼편을 향해 달려오고 있어요. 손을 흔들어 탑승하세요.” 라며

시각 장애인의 눈이 되어주는 모습을 보여요.

▲ ’Happy Birthday with GPT-4o’ 유튜브 영상 캡처

생일 축하합니다~♬

AI와 함께 하는 생일파티 현장은 어떨까요?

영상 속에서 GPT-4o는 케이크와 촛불을 인지한 뒤,

생일을 축하하고 있는 상황을 알아차리는데요.

두 사람에게 케이크를 먹기 위해 생일인 척 하냐는 농담도 던지고,

생일자의 이름을 넣어 축하 노래도 불러줘요.

기계인 듯 기계 아닌 기계 같은 너~

이렇게 AI는 빠른 시간 안에 놀라울 만큼의 발전 속도를 보이고 있는데요.

AI 중에서도 모든 상황에서 스스로 학습하고

판단할 수 있는 AI를 범용 AI(AGI)라고 말해요.

AGI는 언어뿐 아니라 이미지·음성·영상 등의 데이터를

인간처럼 처리하는 수준이라, AI의 끝판왕으로 불려요.

일부 과학자들 사이에서는 GPT-4o가 본격적인 AGI 시대를

열었다는 평가가 나오기도 했답니다.

구글 또한 이에 맞춰 신제품을 발표했는데요.
구글은 AI 비서 ‘프로젝트 아스트라’와 자체 AI 모델 ‘제미나이’를 발표했어요.

AI 시장을 선점하기 위한 오픈AI와 구글의

쟁쟁한 기싸움은 많은 사람들이 주목하고 있어요.

▲ ‘Google I/O '24 in under 10 minutes’ 유튜브 영상 캡처

범용 AI의 시대, 활짝 열린 걸까요

두 기업 외에도 AI 업계의 기술 경쟁은 더욱 뜨거워지고 있는데요.

AGI가 AI의 궁극적 지향점이자 전 세계 기술 패권을 거머쥐는 열쇠로 꼽히면서

글로벌 빅테크 기업들은 AGI 개발에 천문학적인 돈을 쏟아 붓고 있어요.

빅테크 기업들의 AI 전쟁

💡 애플

오픈AI와의 전략적 제휴에 따라 아이폰에 챗GPT를 탑재할 것으로 예상되는데요.

애플의 음성 비서 ‘시리(siri)’가 챗GPT 엔진을 기반으로 작동할 경우 성능이 크게 향상돼요.

💡 마이크로소프트

윈도11에 탑재될 신기능으로 알려진 ‘AI 탐색기(AI Explorer)’ 기능을

곧 선보일 것으로 예상돼요. ‘AI 탐색기 기능’은 사용자가 PC 상에서 보고 듣는 것을

모두 저장 및 요약해 놓았다가 나중에 다시 쉽게 검색할 수 있도록 한 일종의 AI 비서에요.

💡 아마존웹서비스(AWS)

지난해 11월 공개됐던 기업용 AI 챗봇 ‘아마존 큐(Amazon Q)’가 정식 출시됐어요.

아마존 큐는 기업 내부의 모든 데이터를 검색하고 문서 작성을 돕는 것은 물론,

코딩을 모르는 사람도 애플리케이션을 만들 수 있게 해주는 AI 어시스턴트에요.

지난 3월에는 사진, 차트, 문서, 비정형 데이터까지 다루는

멀티모달형 AI ‘클로드 3’를 공개하기도 했어요.

생활 속에 스며들고 있는 AI

현재 AI는 음악과 미술, 동영상 콘텐츠 등에서 널리 활용되고 있어요.

계약서 작성, 판례 분석 등 법률 분야에도 활용되고,

연구개발(R&D) 현장에서는 실험 데이터나 복잡한 과학적 개념의 시각화와

새로운 연구 가설 수립에도 도움을 주죠.

건강 모니터링 및 진단, 질병 예측, 신약 후보 물질 분석 등에서도

AI는 활약 중이에요.

이러한 전문 분야뿐만 아니라 이제 일상생활에서도 궁금증이 생기면

무엇이든 AI에게 대화 형식으로 물어볼 수 있게 됐죠.

사람과 감정을 나누던 AI ‘사만다’가 등장한 영화 <그녀(Her)>의

작중 시대는 2025년이었어요. 공상과학의 영역이었던 대화가 가능한

AI가 영화보다 1년 앞서 등장했다는 것이 신기하지 않나요?

새로운 기술은 늘 명과 암을 동시에 지니지만,

어떤 분야에서 어떻게 활용되느냐에 따라

인간의 삶에서 해결이 어려웠던 부분을 보완해 주기도 하는데요.

기술의 발전이 가져올 놀라운 세상을 기대하면서,

다음 주에도 새로운 소식으로 만나요♥

출처

연합뉴스

[오픈AI, ‘보고 듣고 말하는’ 새 AI 모델 GPT-4o 출시] · 2024.5

https://www.yna.co.kr/view/AKR20240514002900091?input=1195m

뉴시스

[1인 1비서 시대 온다…일상 파고든 AI] · 2024.5

https://www.newsis.com/view/?id=NISX20240517_0002738781&cID=10406&pID=13100

[오픈AI, 영화 ‘Her’ 현실판 공개…구글·애플·삼성도 ‘말하는 AI’ 이식 경쟁] · 2024.5

https://www.newsis.com/view/?id=NISX20240514_0002733758&cID=10406&pID=13100

서울경제

[감정 읽고 상상하는 AI…“3년내 포스트 트랜스포머 모델 출격”] · 2024.5

https://www.sedaily.com/NewsView/2D976Q12PL

미디어오늘

[영화 ‘Her’가 현실로…진짜 사람 같은 GPT가 나타났다] · 2024.5

https://www.mediatoday.co.kr/news/articleView.html?idxno=318110

문화일보

[추론·창작하는 AGI 5년내 나올 듯… 신약개발·기후문제도 해결 기대] · 2024.4

https://stibee.com/api/v1.0/emails/share/Ci4icjY59TKNt-YBNMEzg71J97wF2LY

한경 비즈니스

[“이젠 AI가 카메라로 세상 들여다본다” 오픈 AI, 신형 GPT-4o 공개] · 2024.5

https://magazine.hankyung.com/business/article/202405147829b

💙 피드백 남기기 💙

우리함께 Weekly를구독하고 이메일로 받아보세요

삼양그룹 뉴스레터에 오신 것을 환영합니다📩 🤭

우리함께 Weekly

삼양그룹 뉴스레터에 오신 것을 환영합니다📩 🤭