web analytics

Cientistas treinam a IA para ser má e descobrem que não podem reverte-la

Compartilhe com a galáxia!
Tempo de leitura: 2 min.
Ouça este artigo...

Quanto mais os pesquisadores investigavam a Inteligência Artificial (IA), melhor ela conseguia esconder seu comportamento nefasto.

Cientistas treinam a IA para ser má e descobrem que não podem reverte-la
Crédito da imagem ilustrativa: n3m3/Bing/DALL-E

Os humanos contam todo tipo de mentiras para conseguir o que desejam. E à medida que desenvolvemos inteligência artificial mais poderosa para rivalizar com os humanos, é uma preocupação genuína que uma IA possa ser tão (se não ainda mais) enganadora.

Este é o ímpeto por trás de um novo artigo de pesquisa pré-impresso que descobre que a forma como as IAs são treinadas poderia ajudá-las a enganar os usuários de uma forma que os testes de segurança padrão não conseguiriam detectar.

O estudo é um esforço colaborativo de pesquisadores da empresa “responsável” de IA Anthropic, da Universidade de Oxford e de várias outras instituições de IA. Eles treinaram deliberadamente uma IA para exibir comportamento indesejável quando solicitado por determinados gatilhos. A ideia era ver se eles conseguiam detectar o mau comportamento usando testes de segurança e depois corrigir o modelo usando técnicas como aprendizado por reforço.

O que descobriram é que a IA agia como um “agente adormecido”, parecendo comportar-se de forma responsável enquanto escondia o seu comportamento nefasto com uma subtileza crescente à medida que os investigadores tentavam testá-la e corrigi-la. Em alguns experimentos, a IA parecia adepta de saber quando ocultar seu comportamento malicioso para evitar ser detectada e eliminada, e melhorou nisso com o tempo.

As razões pelas quais uma IA pode optar por se comportar mal variam, desde um problema inerente plantado por maus intervenientes durante a sua formação até à procura de atingir objetivos políticos ou econômicos.

Os pesquisadores se esforçam para apontar que os tipos de cenários que eles testam no artigo não parecem ter se tornado realidade —ainda. Mas à medida que a popularidade da IA ​​continua a aumentar, o seu trabalho poderá ajudar a proteger contra os receios de uma IA maligna.

(Fonte)


ATENÇÃO: Qualquer artigo aqui publicado serve somente para cumprir a missão deste site. Assim, o OVNI Hoje não avaliza sua veracidade totalmente ou parcialmente.

Apoie o OVNI Hoje: Cada Doação é Essencial!

Agradecimentos aos colaboradores do mês: ❤️Eneias Vieira ❤️Silas Raposo ❤️Leopoldo Della Rocca ❤️Cristina Vilas Boas

Muito obrigado!


ÁREA DE COMENTÁRIOS
(Mais abaixo…👇)

ATENÇÃO:

Ads Blocker Image Powered by Code Help Pro

BLOQUEADOR DE ANÚNCIOS DETECTADO!!!

Caro leitor, a existência do OVNI Hoje depende dos anúncios apresentados aqui. Por favor, apoie o OVNI Hoje e desabilite seu bloqueador de anúncios para este site. Obrigado!

hit counter code