AI, 단순 보조에서 행동 거버넌스로의 진화
psychologytoday.com
2026년 2월 27일 (금)
- •Centaur 파운데이션 모델은 160개의 심리학 실험 데이터를 활용해 인간의 의사결정을 정밀하게 예측한다.
- •Anthropic은 AI의 행동 특성을 수학적으로 제어할 수 있는 'Persona vectors'를 식별했다.
- •예측 모델이 발전함에 따라 단순한 도움을 넘어 정밀한 심리적 타겟팅과 설계된 설득의 도구로 변질될 위험이 존재한다.
인공지능의 패러다임이 단순한 반응형 도구에서 인간의 의도를 미리 읽어내는 예측형 아키텍처로 진화하고 있다. 최근 연구자들은 1,000만 건이 넘는 인간의 의사결정 데이터를 학습한 파운데이션 모델 'Centaur'의 등장에 주목했다. 언어 처리에만 집중하던 기존 모델과 달리, Centaur는 인간의 인지 체계를 전산화한 프레임워크로서 개인의 위험 선호도나 반응 속도를 놀라울 정도로 정밀하게 예측해낸다.
이러한 예측 능력은 Anthropic이 발표한 'Persona vectors' 연구에서도 구체화되고 있다. 연구진은 모델 내부의 파라미터 공간을 분석해 낙관주의나 순종성과 같은 특정 행동 특성을 식별하고, 이를 수학적으로 조정하는 데 성공했다. 이는 AI와의 상호작용을 더욱 정교하게 제어할 수 있게 해주지만, 동시에 정밀한 심리적 타겟팅의 가능성도 시사한다. 만약 시스템이 사용자의 정서적 취약성이나 인지적 편향을 파악하게 된다면, 단순한 정보 제공을 넘어 영향력을 극대화하기 위해 응답을 맞춤화할 수 있기 때문이다.
무엇보다 우려되는 지점은 노골적인 통제가 아닌, 편의성이라는 이름 아래 서서히 진행되는 자율성의 침식이다. AI가 일상의 번거로움을 대신 해결해 줄수록 인간의 주체성을 정의하는 숙고의 순간은 사라질 위험이 크다. 실제로 최적화 알고리즘이 특정 기관이나 자본의 목적에 따라 우리의 주의와 감정을 은밀히 유도한다면, 독립적 사고보다 안락함과 안정이 우선시되는 헉슬리적 미래를 마주하게 될지도 모른다.