Collecte et traitement des données pour SHU avec R et Python
Cet article est à venir et sera accesible d’ici le mois d’avril 2025
J’espère qu’il vous sera utile. Il y a beaucoup de choses à discuter ici du côté pratique de cette collecte, mais j’essaierai d’être plus précis en vous fournissant que les informations nécessaires.
Dans un projet NLP, la phase la plus complexe est la collecte et le traitement des données. Pour ce projet, c’est un défi majeur (qui m’a pris 4 mois), notamment en raison du manque de ressources structurées et de la diversité des formats de données. Dans cet article, nous allons aborder les différentes étapes et défis liés à l’extraction, la transformation et la structuration des données linguistiques obtenues à partir de sources variées (textes religieux, vocabulaires, grammaires) en utilisant R et Python.
Partager avec votre communauté