미래지향적: Siri, Alexa, Google Assistant가 정말 도움이 될 것이라고 생각했던 때를 기억하시나요? 맞아요 저도 요. 약 10년이 지난 지금, 우리는 디지털 어시스턴트가 얼마나 발전했는지 보여주는 훨씬 더 인상적인 데모를 보기 시작했습니다. 가능성은 강력하면서도 흥미로워 보입니다.

월요일에 OpenAI는 새로운 GPT-4o 모델과 그에 따른 ChatGPT 업데이트를 공개했습니다. 이를 통해 ChatGPT와 대화할 수 있을 뿐만 아니라 섬뜩할 정도로 현실적인 방식으로 대화할 수 있게 되었습니다. 새로운 모델을 사용하면 좀 더 자연스러운 대화 흐름을 위해 방해할 수 있으며 다른 디지털 보조 장치에서 들었던 것보다 더 많은 개성과 감정으로 응답할 수 있습니다.

iOS 및 Android용으로 업데이트된 ChatGPT 앱을 사용하면 스마트폰 카메라를 통해 더 많은 것을 보고 이해할 수도 있습니다. 예를 들어 OpenAI는 카메라를 사용하여 학생들에게 간단한 수학 문제를 안내할 수 있는 숙제 도우미 앱을 시연했습니다.

그런 다음 화요일 Google은 I/O 개발자 이벤트에서 Android 자체의 유사한 숙제 도우미 기능을 포함하여 Gemini 모델에 대한 광범위한 업데이트를 공개했습니다. Google은 또한 검색을 위한 Gemini 기반 AI 요약, Google Workspace에서 Gemini의 보다 정교한 애플리케이션, OpenAI가 최근 도입한 Sora 모델과 유사한 Veo라는 새로운 텍스트-비디오 알고리즘을 시연했습니다.

두 회사의 데모는 다른 많은 회사가 동시에 개발하고 있는 유사한 기술을 활용했습니다. 더 중요한 것은 지능형 디지털 개인 비서를 만드는 데 필요한 일부 핵심 기능이 거의 손에 닿을 수 있다는 점을 강조했다는 것입니다.

첫 번째는 오디오, 비디오, 이미지 및 보다 정교한 텍스트 입력을 수용하고 이들 간의 연결을 그릴 수 있는 다중 모드 모델에 대한 지원이 점점 더 광범위해지고 있다는 것입니다. 이러한 연결로 인해 데모는 인간이 주변 세계를 인식하는 방식을 모방했기 때문에 마술처럼 보였습니다. 간단히 말해서, 그들은 마침내 우리의 스마트 장치가 실제로 어떻게 “스마트”할 수 있는지 보여주었습니다.

또 다른 명백한 발전은 우리를 대신한 행동을 통해 상황과 환경, 이유를 이해하는 에이전트가 점점 더 정교해지고 있다는 것입니다. 특히 구글의 프로젝트 아스트라(Project Astra) 시연은 추론, 개인/지역 지식, 기억과 결합된 상황별 지능이 어떻게 AI 비서가 “실제”처럼 느껴지게 하는 상호 작용을 생성할 수 있는지를 보여주었습니다.

현재 AI 기반 에이전트가 무엇인지, 무엇을 할 수 있는지에 대한 정의가 업계 전반에 걸쳐 일관되지 않아 해당 에이전트의 발전을 일반화하기가 어렵습니다. 그럼에도 불구하고 OpenAI와 Google이 시연한 시기와 개념적 유사성은 대부분의 사람들이 생각하는 것보다 기능적인 디지털 보조 장치를 갖추는 데 훨씬 더 가까워졌다는 것을 분명히 보여줍니다. 비록 데모가 완벽하지는 않지만, 그들이 보여준 기능과 암시된 가능성은 우리가 불과 몇 년 전만 해도 공상 과학의 영역에 있던 장치의 기능을 갖추는 데 감질나게 가까워지고 있음을 시사합니다.

그러나 잠재적인 응용 프로그램이 훌륭할 수 있는 만큼 이러한 종류의 GenAI 기반 기능이 정기적으로 사용할 가치가 있다는 것을 사람들에게 설득하는 문제가 남아 있습니다. ChatGPT에 대한 초기의 과대 광고가 작년 말에 둔화되기 시작한 이후 일부 사람들이 예상했던 것보다 기술 채택이 더 완만해졌습니다. 남은 것은 이러한 종류의 디지털 보조 애플리케이션이 많은 사람들이 GenAI 기반 기능을 사용하기 시작하게 만드는 계기가 될 수 있는지 여부입니다. 마찬가지로 중요한 것은 생성 AI가 예측한 방식으로 사람들의 삶을 변화시킬 수 있는지 여부입니다.

좋든 싫든 효과적인 디지털 보조자를 얻을 수 있는 유일한 방법은 파일, 커뮤니케이션, 작업 습관, 연락처 등에 자유롭게 액세스할 수 있는 경우입니다.

물론 문제의 일부는 경험과 정보를 자신만의 고유한 방식으로 맞춤화하도록 설계된 다른 기술과 마찬가지로 사람들이 이러한 제품과 회사가 이전보다 자신의 삶에 더 깊이 접근할 수 있도록 기꺼이 허용해야 한다는 것입니다. 그들이 그들로부터 완전한 이익을 얻고 싶다면. 좋든 싫든 효과적인 디지털 보조자를 얻을 수 있는 유일한 방법은 파일, 통신, 작업 습관, 연락처 등에 자유롭게 액세스할 수 있는 경우입니다. 기술 회사와 제품의 영향에 대한 우려가 커지는 시대에 이는 판매하기 어려울 수 있습니다.

미국에서는 Microsoft와 Apple이 앞으로 몇 주 동안 개발자 컨퍼런스에서 어떤 기능을 공개할지에 따라 많은 것이 달라질 것입니다. 미국 스마트폰 시장에서 iPhone의 지배적인 점유율을 고려할 때, Apple이 활성화하기로 선택한 GenAI 기반 기능은 사람들이 수용 가능하고 중요하다고 생각하는 것(자체 개발을 통해서든, OpenAI 또는 Google을 통해 라이선스를 받든, 회사에서 소문이 난 것처럼)에 큰 영향을 미칠 것입니다. ).

이를 Siri의 복수라고 부르세요. 하지만 Apple이 다음 버전의 iOS에 대해 발표하는 디지털 비서나 에이전트 기술은 단기적으로 얼마나 많은 사람들이 이러한 기술 발전을 보는지에 큰 영향을 미칠 것입니다.

궁극적으로 문제는 사람들이 디지털 장치와 이를 통해 지원되는 애플리케이션 및 서비스에 얼마나 더 애착을 가지려는 의지로 귀결됩니다. 우리가 이미 그들과 함께 보내는 시간이 엄청나게 늘어나고 있다는 점을 고려하면, 이것은 기정사실일 수도 있습니다. 그러나 사람들이 이러한 디지털 보조 기능 중 일부를 너무 지나친 것으로 인식할 것인지에 대한 의문이 여전히 남아 있습니다. 한 가지 확실한 점은 이러한 추세를 지켜보는 것이 흥미로울 것이라는 것입니다.

Bob O’Donnell은 기술 산업과 전문 금융 커뮤니티에 전략 컨설팅 및 시장 조사 서비스를 제공하는 기술 컨설팅 회사인 TECHnalytic Research, LLC의 창립자이자 수석 분석가입니다. 트위터에서 그를 팔로우할 수 있습니다 @bobodtech

마스트헤드 크레딧: Solen Feyissa