An application of tools for data collection and analysis in linguistics

Authors

  • Roberlei Alves Bertucci Universidade Tecnológica Federal do Paraná (Brasil)

DOI:

https://doi.org/10.21814/diacritica.5159

Keywords:

Language and technology, Data collection, Automatic text analysis, Social network

Abstract

Technologies modify different human activities and knowledge fields, including language. Thus, some potentialities verified on digital environments for linguistic data interaction must be explored. In order to discuss how to do that, this paper describes three digital tools related to data collection and analysis: firstly, Netvizz App, on Facebook, which contributes to organize corpora by using data from this social network; secondly, Tropes software, which analyses texts from a lexical process, describing elements like text style and word frequency; thirdly, Linguakit program, which selects keyword, presents word frequency and does some sentiment analysis, among other tasks. To show how these tools work, we collect data from El País Brasilon Facebook, at the day which former president Lula has arrested. After this collection, Tropes analysis presented a higher frequency of both connectives and modal expressions, besides lexical items related to that situation. In turn, Linguakit analysis described current elements of Computer Mediated Communication (like abbreviations), besides a higher frequency of specific situation expressions, as well as a negative sentiment related to those comments.

References

Araújo, J. Leffa, V. (Ed.) (2016). Redes sociais e ensino de línguas: o que temos de aprender?. (1ª ed.) São Paulo: Parábola Editorial.

Araújo, L. S. de. (2017). O gênero entrevista radiofônica em comunidades hispânicas: um aporte da Análise Textual Automática. Domínios de Lingu@gem, 11(2), 289–312. Disponível em: DOI: 10.14393/DL29-v11n2a2017-2. Consultado em: 23. abr. 2018. DOI: https://doi.org/10.14393/DL29-v11n2a2017-2

Auroux, S. (2014). A revolução tecnológica da gramatização. (3ª ed.) Campinas, Brasil: Editora da UNICAMP.

Barton, D. & Lee, C. (2015). Linguagem online: Textos e práticas digitais. M. C. Mota (Trad.). (1ª ed.) São Paulo: Parábola Editorial.

Benevenuto, F., Ribeiro, F. & Araújo, M. (2015). Métodos para Análise de Sentimentos em Mídias Sociais. Short course in the Brazilian Symposium on Multimedia and the Web (Webmedia). Manaus. Disponível em: http://homepages.dcc.ufmg.br/~fabricio/download/webmedia-short-course.pdf. Consultado em: 26 abr. 2018.

Bertucci, R. A. & Nunes, P. A. (2017). Interação em rede social: Das reações às características do gênero comentário. Domínios de Lingu@gem, 11(2), 313–338. DOI: 10.14393/DL29-v11n2a2017-3. DOI: https://doi.org/10.14393/DL29-v11n2a2017-3

Cassirer, E. (1979). Antropologia filosófica: Ensaio sobre o homem. São Paulo: Mestre Jou.

Coscarelli, C. V. (2016). Navegar e ler na rota do aprender. In C. V. Coscarelli (Ed.), Tecnologias para aprender. São Paulo: Parábola.

Coulmas, F. Escrita e Sociedade. (2014). São Paulo: Parábola Editorial.

Cupani, A. (2016). Filosofia da tecnologia: um convite. Florianópolis: Editora da UFSC.

Finatto, M. J. B. (2017). Descrição de gêneros textuais/discursivos com apoio computacional. Domínios de Lingu@gem, 11(2), 282–288. doi: 10.14393/DL29-v11n2a2017-1. DOI: https://doi.org/10.14393/DL29-v11n2a2017-1

Linguakit. http://linguakit.com/pt/. Consultado em: 26 abr. 2018.

Manifesto das Humanidades Digitais. THATCamp Paris. 2012. Disponível em: https://humanidadesdigitais.org/manifesto-das-humanidades-digitais. Consultado em: 26 abr. 2018.

Netvizz. https://apps.facebook.com/netvizz/. Consultado em: 26 abr. 2018.

Ortega y Gasset, J. (1965). Meditación de la técnica. Madrid: Espasa-Calpe, (orig. 1939).

Paiva, C. & Paredes-Silva, V. L. (2012). Cumprindo uma pauta de trabalho: Contribuições recentes do PEUL. Alfa, São Paulo, 56(3), 739–770. DOI: https://doi.org/10.1590/S1981-57942012000300002

Portal de Periódicos da Capes. www.periodicos.capes.gov.br. Consultado em: 26 abr. 2018.

Raso, T. & Mello, H. (Eds.) (2012). C-ORAL-BRASIL I: corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG.

Recuero, R. (2012). A conversação em rede: comunicação mediada pelo computador e redes sociais na Internet. Porto Alegre: Sulina.

Rieder. B. (2013). Studying Facebook via data extraction: The Netvizz application. Proceedings of the 5th Annual ACM Web Science Conference, 346–355. DOI: https://doi.org/10.1145/2464464.2464475

Sardinha, T. B. (2000). Corpus Linguistics: History and problematization. DELTA, 16(2), 323–367. Disponível em: http://dx.doi.org/10.1590/S0102-44502000000200005. Consultado em: 26 abr. 2018. DOI: https://doi.org/10.1590/S0102-44502000000200005

Sardinha, T. B. (2005). Trazendo a língua portuguesa para o computador. In T. B. Sardinha (Ed.), A Língua Portuguesa no computador (pp. 269–295). Campinas: Mercado de Letras & Fapesp.

Tropes. http://www.semantic-knowledge.com/tropes.htm. Consultado em: 26 abr. 2018.

Vieira Pinto, Á. (2005). O conceito de tecnologia. Rio de Janeiro: Contraponto.

Published

2020-03-24

How to Cite

Bertucci, R. A. (2020). An application of tools for data collection and analysis in linguistics. Diacrítica, 32(3), 129–155. https://doi.org/10.21814/diacritica.5159