챗GPT, 이제 웹 검색부터 프레젠테이션 작성까지 복잡한 작업 스스로 처리 ChatGPT gets major agent upgrade, now automates workflows from start to finish

Toms guide

ChatGPT’s latest upgrade brings us a step closer to Iron Man’s Jarvis; it can now do the work for you.

From planning a Sunday brunch to creating a competitor analysis slide deck, the upgraded AI can browse the web, click through interfaces, and complete tasks from start to finish, without needing step-by-step guidance.

OpenAI has introduced the new “agent mode” for Pro, Plus, and Team users.

ChatGPT gets major agent upgrade, now automates workflows from start to finish

https://interestingengineering.com/innovation/chatgpt-agent-upgrade-automates-workflows?utm_source=webpush&utm_medium=article

https://youtu.be/1jn_RpbPbEc

ChatGPT AGENT

ChatGPT는 이제 웹 검색부터 프레젠테이션 작성까지 복잡한 작업을 스스로 처리할 수 있습니다.

이 새로운 기능은 기존 연구 성과를 통합하고 챗봇이 가상 컴퓨터 환경에 접근할 수 있도록 지원합니다.

ChatGPT의 최신 업그레이드를 통해 우리는 아이언맨의 자비스에 한 걸음 더 다가갔습니다. 이제 자비스가 여러분을 대신해 작업을 해줍니다.

일요일 브런치 계획부터 경쟁사 분석 슬라이드 덱 작성까지, 업그레이드된 AI는 단계별 안내 없이도 웹을 탐색하고, 인터페이스를 클릭하고, 처음부터 끝까지 작업을 완료할 수 있습니다.

OpenAI는 Pro, Plus, Team 사용자를 위한 새로운 "에이전트 모드"를 도입했습니다.

ChatGPT를 활성화하면 웹사이트를 분석하고, API와 상호 작용하고, 코드를 실행하고, 슬라이드쇼나 스프레드시트와 같은 파일을 전송할 수 있습니다.

이 시스템은 자체 가상 컴퓨터를 사용해 탐색, 추론, 도구 사용을 결합하는데, 마치 완전한 디지털 비서와 같습니다.

즉, 사용자는 ChatGPT에 "경쟁사 3명을 분석하고 슬라이드쇼를 만들어 달라고" 요청할 수 있으며, ChatGPT는 클릭, 필터링, 입력을 통해 이를 수행하고 편집 가능한 출력을 제공합니다.

업그레이드는 이전 두 가지 기능을 통합했습니다. 운영자는 웹사이트를 클릭하고 스크롤할 수 있었고, 심층 조사 기능은 심층적인 정보 분석에 집중했습니다.

ChatGPT can now handle complex tasks on its own, ranging from web searches to building presentations. The new feature pulls together earlier research efforts and gives the chatbot access to a virtual computer environment. The Decoder

이러한 도구는 종종 서로 다른 상황에서 가장 효과적으로 작동했으며, 많은 작업은 그 사이의 틈에 있었습니다.

OpenAI는 자사의 강점을 결합함으로써 ChatGPT가 "클릭, 필터링, 더욱 정확하고 효율적인 결과 수집 등을 통해 웹사이트에 적극적으로 참여할 수 있다"고 밝혔습니다.

웹, 터미널, 코드가 하나의 루프에 통합됨

Gmail이나 GitHub와 같은 커넥터를 지원하므로 에이전트는 사용자의 앱과 워크플로에 연결할 수 있습니다.

인증이 필요한 경우 사용자는 브라우저를 통해 안전하게 로그인할 수 있으며, 로그인 후 ChatGPT가 작업을 다시 시작합니다.

이제 웹 페이지 탐색, 파일 다운로드, 터미널에서 파일 분석, 워크플로우 계속 등을 모두 한 번의 중단 없는 루프로 수행할 수 있습니다.

이 시스템은 단계 사이의 맥락을 기억하고 중단을 지원합니다. 사용자가 중간에 지시를 변경해야 하는 경우, 바로 진행하여 방향을 조정할 수 있으며, 상담원은 처음부터 다시 시작하지 않고도 자동으로 조정합니다. OpenA I는 이 시스템을 "이전 모델보다 훨씬 더 상호 작용적이고 유연하다"고 평가합니다.

이 모델은 평가에서 이미 기존 모델들을 능가합니다. Humanity's Last Exam 에서 최고 수준인 41.6점(1점 만점)을 달성했습니다.

또한 가장 어려운 수학 벤치마크 중 하나로 여겨지는 FrontierMath에서도 27.4%의 정확도를 달성했습니다.

FrontierMath 정확도 점수를 비교한 막대 그래프. ChatGPT 에이전트가 27.4%로 OpenAI o4-mini(19.3%)와 o3(10.3%)를 앞지르고 있습니다.

확장된 도달 범위 속 안전 난간

이러한 확장된 기능은 더 큰 위험을 수반합니다. 에이전트가 웹사이트와 상호 작용하고 개인 커넥터에 접근할 수 있기 때문에 OpenAI는 여러 가지 안전 장치를 도입했습니다.

구매나 이메일과 같이 결과가 따르는 작업에는 사용자의 확인이 필요합니다.

자금 이체와 같은 고위험 행위의 경우, 모델은 완전히 거부하도록 훈련됩니다.

OpenAI가 대비한 주요 위협 중 하나는 바로 '즉각적인 주입' 입니다 . 이러한 공격은 웹사이트 코드에 AI의 동작을 조작할 수 있는 악성 코드를 숨깁니다.

이를 완화하기 위해 OpenAI는 에이전트가 이러한 주입을 차단하도록 훈련하고, 공격을 탐지하기 위한 모니터링 시스템을 구축했으며, 중요한 단계 이전에 사용자 조치가 필요한지 확인했습니다. 필요하지 않은 커넥터는 비활성화하도록 사용자에게 경고합니다.

탐색 세션 또한 비공개로 유지됩니다. OpenAI는 "ChatGPT는 이러한 세션 중에 입력하는 비밀번호와 같은 데이터를 수집하거나 저장하지 않습니다 . 모델에 필요하지 않기 때문이며, 모델이 해당 데이터를 보지 않는 것이 더 안전합니다."라고 말합니다.

이번 출시는 큰 도약을 의미하지만, OpenAI는 이를 초기 단계의 출시로 간주합니다. 슬라이드쇼 서식 지정 및 스프레드시트 편집과 같은 일부 기능은 아직 베타 버전입니다.

하지만 회사 측은 앞으로 몇 달 안에 기능을 확장하고, 오류를 줄이고, 훨씬 더 진보된 실제 작업을 지원하기 위해 노력하고 있다고 밝혔습니다.

https://youtu.be/pKS7UaxzSZ8

ChatGPT gets major agent upgrade, now automates workflows from start to finish

https://interestingengineering.com/innovation/chatgpt-agent-upgrade-automates-workflows?utm_source=webpush&utm_medium=article

KCONTENTS

Engi's Conpaper

챗GPT, 이제 웹 검색부터 프레젠테이션 작성까지 복잡한 작업 스스로 처리 ChatGPT gets major agent upgrade, now automates workflows from start to finish

댓글 없음:

Search

Link

Popular Article

Category

Follow Us