A criação de textos por Inteligências Artificiais (IAs), como por exemplo o ChatGPT, trouxe novos desafios para constatar e diferenciar o conteúdo que humanos geram do que as máquinas produzem. Para acadêmicos, editores e profissionais, é importante identificar textos desse tipo com o intuito de manter a integridade das informações e evitar fraudes.
Então, neste artigo, iremos ver como identificar textos feitos pelo ChatGPT e também explorar o surgimento da ferramenta Gotcha GPT. Juntamente com isso, explicaremos o funcionamento da mesma, bem como ela pode evoluir e se tornar mais acessível.
Como identificar textos que o ChatGPT criou?
Para identificar textos que o ChatGPT foi responsável por criar, existe uma ferramenta que se chama Gotcha GPT. Nesse sentido, criou-se a mesma com foco em detectar textos gerados por IA e requer alguns conhecimentos em Python. Desse modo, para quem possui essas práticas, o processo pode ser feito nas etapas que estão descritas no passo a passo abaixo:
- Baixe os arquivos: acesse o repositório de código aberto do Gotcha GPT no Github (github.com) e faça o download dos arquivos necessários;
- Abra o arquivo IPYNB: use um ambiente como o Google Colab para abrir os arquivos que baixou. Nele, o código será executado;
- Importe as bibliotecas: insira as bibliotecas que estão especificadas no código de exemplo da ferramenta;
- Calcule Perplexity e Burstiness: essas funções ajudam a medir a previsibilidade e a variabilidade dos textos, indicando se os mesmos foram gerados por Inteligência Artificial;
- Envie os textos para análise: o Gotcha GPT aceita arquivos no formato DOCX (Word). Logo, envie o conteúdo a ser verificado em tal formato (a ferramenta suporta textos em português e inglês);
- Execute os cálculos: após carregar o arquivo no formato adequado, execute as funções que calculou anteriormente para obter um relatório de análise;
- Use os arquivos de treinamento do Github: além dos textos a serem analisados, use os textos de base da própria ferramenta. Eles irão calibrar a mesma;
- Avalie os resultados: o relatório final que o recurso gerar indica a probabilidade de o texto analisado ter sido escrito por uma IA, como o ChatGPT;
Como surgiu esse recurso?
A criação do Gotcha GPT atende a uma necessidade crescente de identificar textos criados por Inteligências Artificiais, especialmente no meio acadêmico. Sendo assim, a ferramenta foi desenvolvida pelo professor André Pimentel, do CTC/Puc-Rio.
Pimentel fez isso em resposta a demandas específicas de editores de revistas científicas, como a American Chemical Society. Eles enfrentam desafios na revisão por pares de artigos de “origem duvidosa”, e a ferramenta é uma forma de lidar com essa dificuldade.
Segundo o professor, os editores de revistas científicas têm que seguir um protocolo rígido de ética. Em outras palavras, eles não podem enviar documentos para plataformas online de detecção de IA, pois isso violaria a confidencialidade, os direitos de privacidade e de propriedade dos autores.
Assim, o Gotcha GPT surge como uma alternativa segura, permitindo que editores e acadêmicos façam a verificação em um ambiente controlado e sem comprometer informações confidenciais.
Esse contexto acadêmico inspirou a criação de uma ferramenta que, além de identificar textos gerados por Inteligência Artificial, contribui para o debate sobre o uso ético de assistentes de IA na criação de conteúdo.
Como é o funcionamento do Gotcha GPT?
O Gotcha GPT é uma ferramenta de código aberto, disponível gratuitamente com licença MIT no Github, que se usou Python para desenvolver. A estrutura da ferramenta é compatível com o Google Colab, um ambiente popular para desenvolvedores e cientistas de dados.
No desenvolvimento do Gotcha GPT, utilizaram-se bibliotecas de aprendizado de máquina como por exemplo o Scikit-learn. Elas permitiram a criação de algoritmos especializados para a análise de textos.
A ferramenta opera com base em uma coleção de textos científicos das revistas American Chemical Society e Sociedade Brasileira de Química. Esses textos servem como base de dados estruturados, oferecendo um padrão de comparação com os conteúdos analisados.
O Gotcha GPT utiliza métodos de análise de padrões, como o cálculo de Perplexity, que mede o grau de previsibilidade de um texto. Dessa forma, textos que uma Inteligência Artificial gerou tendem a ser mais previsíveis e, portanto, com menor perplexidade.
Em paralelo, a ferramenta também calcula a Burstiness, uma métrica que indica a variabilidade do uso de palavras, já que textos humanos apresentam mais variação em tal aspecto. Juntos, esses cálculos ajudam a distinguir o conteúdo humano do que uma IA criou.
Por fim, usuários que desejam usar o Gotcha GPT para outros fins também têm a opção de treinar a ferramenta com bases de dados diferentes, ampliando o seu alcance e a sua precisão. No entanto, com a base atual, o recurso já oferece um desempenho robusto para a análise de artigos científicos nas áreas mencionadas.
A ferramenta de identificar textos pode evoluir e ficar mais acessível?
O setor de identificar textos que uma Inteligência Artificial criou ainda está em desenvolvimento, com muitas possibilidades de evolução. Nesse sentido, o Gotcha GPT, embora funcional e eficaz, ainda demanda conhecimentos técnicos em Python.
Isso limita seu uso para pessoas que têm esse conhecimento ou com disposição para aprender. Para tornar a ferramenta mais acessível, futuros desenvolvimentos podem incluir uma interface gráfica, permitindo que pessoas sem experiência em programação utilizem o sistema de maneira intuitiva.
Em conjunto a isso, conforme a popularidade e o uso de recursos de IA aumentam, é possível que recursos como o Gotcha GPT evoluam para suportar outros idiomas e formatos de texto. Isso é algo que aumentaria sua versatilidade.
Por último, a ferramenta também poderá se adaptar às novas versões de Inteligências Artificiais, que apresentam capacidades cada vez mais sofisticadas, tornando o processo de identificar textos que a IA gerou mais complexo.
Em suma, essas possíveis melhorias indicam que o Gotcha GPT pode ser tornar uma solução constantemente mais presente em instituições acadêmicas, editoras e outras áreas onde a integridade da autoria é essencial. Com o avanço das Inteligências Artificiais, a demanda por ferramentas para identificar textos que as IAs geraram tende a crescer, e o desenvolvimento contínuo desses recursos é uma resposta a essa necessidade.