SPAD Intégral : data mining et text mining Le logiciel SPAD Intégral reprend les fonctionnalités des logiciels SPAD Profiling,
Scoring et Data Mining et intègre en complément l'analyse de données
textuelles (Text Mining) et un outil dédié au traitement d'enquêtes :
SPAD Question. SPAD Intégral est la solution la plus complète de
la gamme SPAD.
La grande force du text mining avec le logiciel SPAD est le
traitement en parallèle des données numériques classiques et des
données textuelles, ces deux sources de données s'enrichissant
mutuellement.
Analyse de données textuelles - Text Mining
- Traitement simultané d'une ou plusieurs variables textuelles
- Construction du vocabulaire : mots et segments répétés (segment = suite de mots)
- Gestion de la casse (Majuscules, minuscules…)
- Gestion des séparateurs de mots, de phrases,
- Gestion des seuils pour la création des segments de mots ou suites de mots répétées
- Modification du vocabulaire avec un lemmatiseur semi-automatique
- Affichage du vocabulaire initial et du vocabulaire modifié
- Tri du vocabulaire par fréquence, par ordre alphabétique
- Filtrage multi-critères et sélection de mots
- Corrections de mots ou segments
- Création de synonymes
- Suppression de mots et de segments
- Enregistrement de règles de lemmatisation, ré-utilisables pour tout autre vocabulaire
- Edition des statistiques sur les mots et segments répétés (fréquences, longueurs en nombre de caractères et en nombre de mots)
- Edition des contextes de mots
- Vocabulaire spécifique de sous-populations définis par des modalités : mots et phrases caractéristiques
- Création d'un tableau lexical de contingence,
- Analyse des correspondances simples sur tableau lexical et classification
- Création d'une base SPAD comprenant les Variables initiales, les mots et les segments en colonnes
- Analyse discriminante textuelle
- Toutes les analyses de SPAD
SPAD Question
- Création de questionnaires
- Utilisation de bibliothèques de questions
- Types de questions : fermée unique, numérique, échelle d'accord, choix multiple, rang, ouverte, date
- Regroupements de questions par thèmes
- Création automatique de masques de saisie sous contrôle permettant l'interrogation directe au téléphone
- Définition des enchaînement de questions par filtres multi-critères,
- Non-réponses et non-concernés gérés automatiquement
- Souplesse d'utilisation : modification de l'ordre des
questions, ajout, suppression ou insertion de questions et/ou de
modalités en phase de paramétrage mais aussi après avoir déjà saisi des
réponses
- Puissantes fonctions de codage permettant de transformer les variables d'origine
- Définition de plans de tri pour l'automatisation d'enquêtes récurrentes
- Tris à plat et tris croisés complets avec édition automatique de tableaux et graphiques dans Excel, Word, html
- Bilans d'image avec la méthode SATIMIX
- Fusion des fichiers et fichiers hiérarchisés
Tous les résultats peuvent être automatiquement mis en forme automatiquement
dans Excel.Comme pour toutes les procédures conçues pour le logiciel,
les calculs peuvent être effectués sur la base complète ou sur toute
sous-population définie par des filtres logiques, par sélection sur liste ou encore par échantillonnage. Tous les calculs tiendront compte le cas échéant d'une variable de pondération ou de redressement. Le traitement des données manquantes est particulièrement souple et adapté aux différentes procédures statistiques.
|