... | ... | @@ -71,7 +71,7 @@ nothing to commit, working tree clean |
|
|
- `count-all` se base sur ces index pour générer un compte des nombreux types d'objets de Macao (cf [Concepts et objets de MACAO](Concepts-et-objets-de-MACAO)). Avec `--force`, les index sont régénérés du même coup.
|
|
|
|
|
|
|
|
|
## Extraction / conversion
|
|
|
# Extraction / conversion
|
|
|
|
|
|
**Avant le premier lancement**, l'environnement de développement Python doit être initialisé (virtualenv, dépendances...) avec **`mcli setup`**.
|
|
|
|
... | ... | @@ -80,11 +80,11 @@ Chacune des trois étapes `extract`, `transform` et `export` est disponible indi |
|
|
|
|
|
L'extraction des audios à partir des fichiers Flash se fait séparément (et sans Python) avec `mcli extract-mp3`.
|
|
|
|
|
|
### Debugging
|
|
|
## Debugging
|
|
|
`mcli` passe au programme de conversion des variables d'environnement qui varient selon la version. Pour débuguer un cas précis, `mcli setup-debug` ne lance rien mais écrit ces variables dans un fichier `tetras_extraction/script/.env` (ignoré par Git). Le debugger ou IDE peut ainsi être configuré pour sourcer ce fichier à l'exécution.
|
|
|
|
|
|
|
|
|
# Résultats d'extraction
|
|
|
## Résultats d'extraction
|
|
|
Le dossier `tetras_extraction/result` contient 3 dossiers, qui correspondent respectivement au résultat d'extraction de Macao 12, Macao 3, et des deux réunis.\
|
|
|
Chacun suit la même structure:
|
|
|
- `macao_content.ttl` : graphe RDF de la phase d'extraction
|
... | ... | |