Données personnelles et Big Data
- Les données
Une donnée est une information sur une personne, un objet, un évènement, etc..
On distinguera:
- Les données personnelles
Les données personnelles sont les données qui identifient une personne directement ( son nom, son prénom, une image de vidéosurveillance, etc..) ou indirectement ( empreinte digitale, localisation du téléphone, plaque d'immatriculation, numéro de sécurité sociale, etc..).
Les données personnelles sont sensibles, elles peuvent être utilisées à des fins malveillantes ( usurpation d'identité, espionnage, etc..)
EXERCICE 1
- Rechercher sur le site de la CNIL quelle est la technique utilisée par les personnes malintentionnées pour usurper votre identité: Le site de la CNIL
- Rechercher sur le site de la CNIL ce que risque un usurpateur.
- Les métadonnées
Les métadonnées sont des informations supplémentaires ajoutées à certaines données comme les fichiers de bureautique, les pages web, les images ou les fichiers son. Les informations supplémentaires seront l'auteur, la date de création, l'appareil utilisé, etc..

Pour quelle utilisation ?
- Les méta-données contenues dans le code html de la page sont utilisées :
- Par les moteurs de recherche, par exemple pour mieux décrire une page
- Par les navigateurs, notamment pour afficher le titre de la page dans l’onglet de navigation.
- Par les réseaux sociaux, pour utiliser un texte pertinent lors du partage d’un contenu.
- Les méta-données d'un fichier de musique sont utilisées pour afficher les informations comme le titre du morceau
et l'auteur sur le lecteur de musique.
- Les méta-données d'un fichier de bureautique ( titre, auteurs, date de création, mots clés) sont utilisées pour organiser, retrouver les fichiers et les identifier facilement. Vous pouvez également rechercher vos documents à partir des métadonnées et insérer celles-ci dans vos documents.

Exemple:


EXERCICE 2
- Télécharger le fichier word document1.docx: cliquer-ici
- Copier ce document dans devoir/gautier
- Ajouter les mots clés: SNT, données structurées dans document1 ( voir méthode ci-dessous):

- Télécharger le fichier word document2.docx: cliquer-ici
- Copier ce document dans devoir/gautier
- Ajouter les mots clés: SNT, données structurées, maths dans document2
- Rechercher le document word avec la barre de recherche en précisant les mots clés SNT et données structurées et que vous ne voulez pas le mot maths dans le document.
- Faire une capture du résultat de la recherche qui fait apparaître la localisation du document votre_nom\documents\devoir\gautier
- Le big data ( données massives) et Cloud
Le terme big data désigne l'énorme quantité de données récoltées dans le monde qui sont stockées dans le cloud ( sur des serveurs de stockage distants). Ces données aident au développement de l'IA , au progrès de la médecine, etc.. mais elles posent divers problèmes comme l'a montré Edward Snowden, elles peuvent être récupérées par des états ou des entreprises pour savoir des choses qui ne les concernent pas. Outre l'aspect sécurité, elles posent un problème environnemental, les données sont stockées dans des centres de données sur des serveurs énergivores. On estime qu'en 2030 le numérique sera le premier consommateur énergétique de la planète.
En Europe le RGPD ( Règlement Général sur la Protection des Données) limite le traitement et la circulation des données personnelles. Au nom de la liberté d'expression et pour faciliter leurs affaires, les USA essaient de nous faire abandonner le RGPD.
EXERCICE 3
La consommation électrique d'un data center peut être répartie de la manière suivante:
- Représenter cette répartition sous forme de diagramme radar puis de Camembert avec Excel.
- Comment peut-on réduire cette consommation d'énergie?
- Les données ouvertes (open data)
Les données ouvertes sont des données libres de droits, elles servent à des fins de recherche. Des sites comme data.gouv.fr ou opendata.paris.fr en proposent sur beaucoup de sujets.
EXERCICE 4
- Rechercher sur le site data.gouv.fr parmi les données relatives à l'éducation le jeu de données concernant les Effectifs d’élèves par niveau, sexe, langues vivantes 1 et 2 les plus fréquentes.
- Télécharger le jeu de données au format csv et le copier dans devoir\gautier
- Ouvrir le document avec Excel et rechercher la ligne concernant le lycée JH Fabre. Pour limiter le nombre de données: utiliser l’outil Filtrer (encadré en rouge ci-dessous, cliquer sur la petite flèche à droite de Commune (encadré en rouge ci-dessous), désélectionner toutes les villes puis cocher Carpentras, valider avec OK.
- Relever et noter dans votre compte rendu le nombre d'élèves en seconde , le nombre de filles et le nombre de garçons

Résultat du filtrage, seuls les lycées de Carpentras apparaissent:

Créé avec HelpNDoc Personal Edition: Générateur de documentation et EPub gratuit