Processo di estrazione terminologica

Data is like garbage. You should know what to do with it before you collect it. Mark Twain

Estrazione terminologica: Definizione

Con il termine „estrazione terminologica“ – anche Text Mining – viene inteso il processo di estrazione automatica della terminologia (termini o frasi) da basi di dati testuali. L’estrazione di terminologia si sta dimostrando attività strategica non solo per i processi di gestione delle traduzioni e della conoscenza, ma anche nelle attività di Competitive Intelligence, Market Research e ottimizzazione dei motori di ricerca (Search Engine Optimization). In generale, le attività di estrazione terminologica sono indispensabili per la gestione efficace ed efficiente del sapere nell’organizzazione e per assicurare la competitività aziendale.

I ritorni economici dell’estrazione terminologica

L’estrazione della terminologia è prerogativa per molte delle attività aziendali. Nella gestione dei processi di traduzione, l’estrazione terminologica permette l’identificazione della frequenza della terminologia e il grado di difficoltà consentendo di calcolare in modo preciso tempi di traduzione e i relativi costi. Fornendo anticipatamente le caratteristiche peculiari della terminologia, l’estrazione terminologica consente di migliorare la qualità delle traduzioni ma anche l’intero il processo di traduzione.

Come prodotti diretti dei progetti di estrazione terminologica, glossari, tassonomie e concept maps si stanno dimostrando essenziali nei progetti di Bilancio della Conoscenza. Essi forniscono infatti la struttura portante per l’identificazione di conoscenza strategica dell’organizzazione e la costruzione e di alberi della conoscenza.

I progetti di estrazione terminologica permettono anche di identificare e sviluppare classificazioni, metadati e di modellare basi di dati terminologiche. Glossari, tassonomie di prodotti e metadati si stanno dimostrando funzionali ed efficaci anche nelle attività di Ottimizzazione dei motori di ricerca. Essi infatti permettono al Marketing di migliorare la ricerca di keywords, l‘analisi delle parole chiavi dei competitors, la scelta di sinonimi e parole chiave con il maggior CTR per una conversione ottimale delle attività dell’online shops.

Da quali fonti estrarre la terminologia?

I sistemi aziendali più adatti per l’estrazione di terminologia sono i sistemi di redazione e le memorie di traduzione (translation memories). Questi sistemi condensano infatti la terminologia aziendale in forma compatta e strutturata consentendo di ottenere risultati di estrazione terminologica „puliti“ e organizzati. In mancanza di tali sistemi si può procedere all’estrazione della terminologia da sistemi di content management (CMS), da cataloghi elettronici o da sistemi per la gestione delle liste di prodotti (sistemi PLM). In linea generale, maggior è il grado di strutturazione dei dati a disposizione, più facile sarà il processo di organizzazione e sistemazione dei termini estratti.

Processo di estrazione terminologica

Se non viene meticolosamente studiata e pianificata l’estrazione terminologica può portare ad un numero talmente elevato di termini da renderne difficile la gestione. Per questo è necessario stabilire sin dall’inizio una strategia di estrazione terminologica e il relativo processo. In particolare:

  • gli obiettivi (che cosa si intende estrarre? termini singoli o elementi sintattici?);
  • le fonti (memorie di traduzione o liste prodotti?);
  • le lingue (inglese, tedesco, cinese? monolingua o bilingua?);
  • il metodo di selezione e ordinamento dei termini (linee guida per la terminologia);
  • eventuali glossari già esistenti nell’organizzazione da incorporare in qualità di Ausschlusslisten;
  • il database model da utilizzare per l’import dei risultati dell’estrazione terminologica;
  • una classificazione dei campi di sapere studiata e funzionale;
  • il processo automatico di integrazione dei dati estratti in database terminologici già esistenti;

Queste sono solo alcune delle domande alle quali bisogna trovare risposta „prima“ dell’estrazione terminologica e la quale risposta assicurano il successo del processo di estrazione della terminologia.

L’estrazione terminologica come processo sostenibile

Fattore deciso per la sostenibilità economica del complesso processo di estrazione terminologica è la capacità di trasformarlo in un processo ripetitibile e di integrarlo nella mappa dei processi aziendali gestionali e produttivi. Ciò comporta la descrizione e rappresentazione del processo di estrazione nelle sue singole componenti e l’integrazione precoce nella catena produttiva aziendale.

 

DOMANDE

REFERENZE

Schreib einen Kommentar

Please use your real name instead of you company name or keyword spam.