Nouveau logiciel de conservation : préparation étape par étape des données et du code de sciences sociales pour publication et conservation

Nouveau logiciel de conservation : préparation étape par étape des données et du code de sciences sociales pour publication et conservation

Blocs de contenu du modèle G
Sous-éditeur

Alors que le partage de données devient plus répandu dans les sciences naturelles et sociales, la communauté de la recherche s'efforce de répondre aux exigences de gestion et de publication des données de manière à faciliter le partage. Malgré la disponibilité de référentiels et de plans de gestion des données de recherche, des préoccupations fondamentales subsistent quant à la meilleure façon de gérer et de conserver les données pour une utilisation à long terme. La valeur des données partagées est étroitement liée à leur facilité d'utilisation, et une grande question demeure : quels outils prennent en charge la préparation et l'examen des documents de recherche pour la réplication, la reproductibilité, la réutilisation et la réutilisation ? Cet article décrit les principales tâches de curation et le nouveau logiciel de curation de données conçu spécifiquement pour examiner et améliorer les données de recherche. Il est développé par deux groupes de recherche, l'Institution for Social and Policy Studies de l'Université de Yale et Innovations for Poverty Action, en collaboration avec Colectica. Le logiciel comprend des étapes de curation conçues pour améliorer le matériel de recherche et ainsi permettre aux utilisateurs de tirer une plus grande valeur des données : vérification des métadonnées au niveau des variables et au niveau de l'étude, vérification que le code peut reproduire les résultats publiés et s'assurer que les PII sont supprimés. L'outil est basé sur les meilleures pratiques d'archivage de données et s'intègre dans les workflows de stockage et de recherche. Il est open source, extensible et aidera à garantir que les données partagées peuvent être utilisées.

18 avril 2016