Investigando Modelos de IA: GPT-4, Sabiá-3 e DeepSeek-R1 na Interpretação de Notícias Históricas sobre a Ditadura Militar no Brasil

Autores

DOI:

https://doi.org/10.21814/h2d.6680

Palavras-chave:

LLM, historical text, data engineering, digital humanities, computational social sciences

Resumo

Este estudo analisa como grandes modelos de linguagem (LLMs) — ChatGPT (OpenAI), Sabiá-3 (MaritacaAI) e DeepSeek (China) — interpretam textos históricos brasileiros referentes ao período da ditadura militar (1964–1985). Utilizando um conjunto de dados curado, composto por dezesseis matérias de jornais processadas por OCR e previamente classificadas quanto à sua orientação (favorável, crítica ou neutra), o estudo selecionou três textos representativos para uma análise detalhada. Avaliou-se as respostas dos modelos a partir de um prompt de sentimento político, por meio de similaridade cosseno, frequência lexical e TF-IDF class-based (c-TF-IDF). Os resultados revelam convergência semântica entre os modelos, mas divergência significativa nas estratégias discursivas. O ChatGPT tende a neutralizar enquadramentos ideológicos, o DeepSeek foca na desconstrução retórica, enquanto o Sabiá-3 privilegia uma interpretação literal, frequentemente deixando de captar críticas implícitas ou nuances históricas. Esses padrões estão relacionados à arquitetura dos modelos, ao design linguístico e, especialmente, à qualidade e curadoria dos dados de treinamento. Apesar de ser um modelo brasileiro, o Sabiá-3 apresenta limitações interpretativas, sugerindo que dados nacionais de treinamento, por si só, são insuficientes sem uma mediação historiográfica crítica. Os achados levantam preocupações quanto a vieses algorítmicos, soberania digital e às políticas culturais imbricadas nas tecnologias de IA. A pesquisa reforça a importância de corpora historicamente informados e criteriosamente curados na formação de LLMs voltados a línguas sub-representadas. Trabalhos futuros ampliarão o conjunto de dados e investigarão como o design de prompts e a versionamento dos modelos influenciam os resultados interpretativos.

Downloads

Não há dados estatísticos.

Referências

Abonizio, H., Almeida, T. S., Laitz, T., Malaquias Jr., R., Kerche Bonás, G., Nogueira, R., & Pires, R. (2024, outubro). Sabiá-3 Technical Report. Maritaca AI. https://arxiv.org/abs/2410.12049

Duncan, C., & McCulloh, I. (2023). Unmasking bias in ChatGPT responses. Proceedings of the IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. https://doi.org/10.1145/3625007.3627484

Grootendorst, M. (2020). Creating a class-based TF-IDF with Scikit-Learn. maartengrootendorst.com. https://maartengrootendorst.com/blog/ctfidf/

Hajikhani, A., & Cole, C. (2024). A critical review of large language models: Sensitivity, bias, and the path toward specialized AI. Quantitative Science Studies, 5(3), 736–756. https://doi.org/10.1162/qss_a_00310

Hayder, W. A. (2025). Highlighting DeepSeek-R1: Architecture, Features and Future Implications. International Journal of Computer Science and Mobile Computing, 14, 1-13.

Milyaev, S., Barinova, O., Novikova, T., Artemyev, A., & Konushin, A. (2013). Image binarization for end-to-end text recognition in natural scenes. In 2013 12th International Conference on Document Analysis and Recognition (pp. 1224–1228). IEEE. https://doi.org/10.1109/ICDAR.2013.246

OpenAI. (n.d.). GPT-4 research. Retrieved September 23, 2025, from https://openai.com/pt-BR/index/gpt-4-research/?utm_source=chatgpt.com

Smith, R. (2007). An overview of the Tesseract OCR engine. In 2007 Ninth International Conference on Document Analysis and Recognition (pp. 629–633). IEEE. https://doi.org/10.1109/ICDAR.2007.4376991

Tao, Y., Viberg, O., Baker, R. S., & Kizilcec, R. F. (2024). Cultural bias and cultural alignment of large language models. PNAS Nexus, 3, pgae346. https://doi.org/10.1093/pnasnexus/pgae346

Törnberg, P. (2023). ChatGPT-4 outperforms experts and crowd workers in annotating political Twitter messages with zero-shot learning. Amsterdam Institute for Social Science Research, University of Amsterdam. https://arxiv.org/abs/2304.06588

Downloads

Publicado

09-10-2025

Como Citar

Gustavo Moreira Calixto, Belo Angeluci, A. C. ., & Elias Cunha Bitencourt. (2025). Investigando Modelos de IA: GPT-4, Sabiá-3 e DeepSeek-R1 na Interpretação de Notícias Históricas sobre a Ditadura Militar no Brasil. H2D|Revista De Humanidades Digitais, 7(1), e6680. https://doi.org/10.21814/h2d.6680