Boucle de traitement pour parallélisation
Pour paralléliser le traitement, il y a deux boucles à prendre en compte. Dans _main_
: regarder méthode parse_document_file_to_produce_amr_graph
puis __analyze_line_set_to_produce_amr_graphs
.
Il y a d'abord une analyse du fichier pour produire un set de phrases, puis une préparation du traitement pour avoir une liste de données à traiter (Work_Data, voir classe correspondante). Puis, il y a deux boucles sur la liste de Work_Data :
- pour produire les graphes AMR
- pour sérialiser les graphes AMR
Deux options sont envisageables : (1) regrouper les traitements pour n'avoir qu'une seule boucle, ou (2) paralléliser au niveau de chaque boucle. Je pense que les deux se valent, mais ce serait peut-être plus simple à maintenir sur le durée de n'avoir qu'un seule boucle (ou possiblement plus simple à paralléliser).