Données de Guestviews

Initialement, environ 30000 commentaires issus de livres d’or ont été obtenus pour les années 2016, 2017, 2018. Ils sont issus d’entités de Paris Musées. En plus des commentaires, nous avons quelquefois un identifiant d’utilisateur pseudonymisé, son âge, son pays d’origine, sa langue, son département s’il vient de France.

Un chargement de nouvelles données est effectué chaque fois que nécessaire. Cette opération sera automatisée ultérieurement.

Voir le document Mise en forme des données Guestviews (privé) pour plus de détails.

Des tests d’analyse d’opinion ont commencé à être réalisés (au 3/10/2018) pour estimer si le commentaire paraît positif, négatif ou neutre (ou pas déterminé).

Les données récoltées avec l’API sont stockées sur Teralab/NextCloud dans le dossier partagé Sources, sous-dossier SourceGuestviews/ParisMusées. Les données pseudonymisées sont dans des fichiers json par année (2016, 2017, 2018).

Un sous-dossier TTL contient une traduction en RDF de ces mêmes données afin de pouvoir les incorporer à notre graphe de données.

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/apps/files/?dir=/Sources/SourceGuestviews&fileid=129

Auteur : Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes

Commentaires Clos.