Cientistas treinam a IA para ser má e descobrem que não podem reverte-la

Compartilhe este artigo com a galáxia!
Tempo de leitura: 2 min.
Ouça este artigo...

Quanto mais os pesquisadores investigavam a Inteligência Artificial (IA), melhor ela conseguia esconder seu comportamento nefasto.

Crédito da imagem ilustrativa: n3m3/Bing/DALL-E

Os humanos contam todo tipo de mentiras para conseguir o que desejam. E à medida que desenvolvemos inteligência artificial mais poderosa para rivalizar com os humanos, é uma preocupação genuína que uma IA possa ser tão (se não ainda mais) enganadora.

Este é o ímpeto por trás de um novo artigo de pesquisa pré-impresso que descobre que a forma como as IAs são treinadas poderia ajudá-las a enganar os usuários de uma forma que os testes de segurança padrão não conseguiriam detectar.

O estudo é um esforço colaborativo de pesquisadores da empresa “responsável” de IA Anthropic, da Universidade de Oxford e de várias outras instituições de IA. Eles treinaram deliberadamente uma IA para exibir comportamento indesejável quando solicitado por determinados gatilhos. A ideia era ver se eles conseguiam detectar o mau comportamento usando testes de segurança e depois corrigir o modelo usando técnicas como aprendizado por reforço.

O que descobriram é que a IA agia como um “agente adormecido”, parecendo comportar-se de forma responsável enquanto escondia o seu comportamento nefasto com uma subtileza crescente à medida que os investigadores tentavam testá-la e corrigi-la. Em alguns experimentos, a IA parecia adepta de saber quando ocultar seu comportamento malicioso para evitar ser detectada e eliminada, e melhorou nisso com o tempo.

As razões pelas quais uma IA pode optar por se comportar mal variam, desde um problema inerente plantado por maus intervenientes durante a sua formação até à procura de atingir objetivos políticos ou econômicos.

Os pesquisadores se esforçam para apontar que os tipos de cenários que eles testam no artigo não parecem ter se tornado realidade —ainda. Mas à medida que a popularidade da IA ​​continua a aumentar, o seu trabalho poderá ajudar a proteger contra os receios de uma IA maligna.

(Fonte)



Apoie o OVNI Hoje: Cada Doação é Essencial para continuidade deste site!

Agradecimentos aos colaboradores do mês:  ❤️Silas Raposo ❤️Edward Vaz ❤️Cris Vilas Boas


ÁREA DE COMENTÁRIOS

Todos são bem-vindos a participar da área de comentários abaixo. Contudo, os comentários são de responsabilidade única e exclusiva de seus próprios autores. Ou seja, o site OVNI Hoje não se responsabiliza por quaisquer inconveniências ou conflitos por eles causados.

Importante: Antes de comentar, atente-se às regras da Área de Comentários e evite ser banido. As regras podem ser acessadas clicando aqui.

IAinteligência artificial
Comentários não são disponíveis na versão AMP do site. (0)
Clique aqui para abrir versão normal do artigo e poder comentar.