Vos données, notre travail

firefox logo wordmark vert RGB 300 dpiPermettez-moi de vous poser une question : à quelle fréquence pensez-vous à vos données de Firefox ? Moi, je pense à vos données de Firefox tous les jours, car c’est mon travail. À la tête de l’équipe dédiée à la science des données pour Firefox, je dirige un groupe de scientifiques qui contribuent au développement de Firefox en déterminant la direction de la stratégie produit grâce à l’interprétation des données que nous collectons. Être une scientifique spécialiste des données chez Mozilla signifie que mon objectif est de m’assurer que les utilisateurs de Firefox peuvent faire des choix éclairés en matière de participation à nos efforts de collecte de données, sans sacrifier notre capacité à collecter des données utiles et de haute qualité, ce qui est essentiel pour prendre des décisions produit plus judicieuses.

Pour atteindre cet équilibre, j’ai travaillé avec des collègues dans toute l’organisation afin de simplifier et de clarifier nos pratiques et nos politiques de collecte des données. Notre but est de vous faciliter au maximum la tâche pour que vous puissiez simplement décider si oui ou non vous souhaitez partager vos données d’utilisation avec nous. Il y a peu, vous avez pu apercevoir des mises à jour concernant des changements à venir à propos de la collecte de données et sur la façon dont nous collectons ces données, et aussi sur la manière dont nous partageons les données que nous collectons. Ces éléments font partie d’une stratégie plus large visant à harmoniser nos pratiques de collecte de données avec un ensemble de principes fondamentaux qui permettent de vous informer sur la manière dont nous travaillons et communiquons au sujet des données que nous collectons.

De notre côté, nous avons dû nous adapter : nous avons modifié les systèmes permettant la collecte de données pour Firefox et, par conséquent, nous avons mis à jour les préférences de collecte de données. Vos Firefox utilisent désormais un seul système de télémétrie contre deux auparavant (le bilan de santé Firefox, et la télémétrie non activée par défaut). L’un était activé par défaut, l’autre non, mais en pratique le type de données collectées était sensiblement le même pour ces deux différents canaux. Depuis peu, nous utilisons donc un système unique de « Télémétrie unifiée » qui combine les deux systèmes au sein d’une plateforme unique de collecte de données, ainsi nous n’avons plus de paramètres séparés comme c’était le cas pour les anciennes versions.

Si vous utilisez Firefox depuis longtemps et que vous aviez autorisé la collecte de données pour le bilan de santé de Firefox mais que vous étiez abstenu·e d’activer la télémétrie dans les paramètres avancés, nous continuerons de collecter le même type de données techniques et d’informations d’interaction qu’auparavant via la plateforme de Télémétrie unifiée. Les autres sources de collecte de données sont soit réservées aux préversions, soit activables par l’utilisateur. De cette manière, vous avez toujours le choix et la maîtrise de la façon dont Firefox collecte vos données.

Les quatre piliers de notre stratégie de collecte de données

Nous nous sommes concentrés sur quatre grands axes lorsque nous avons décidé d’ajuster les paramètres de la collecte de données. Cela signifie qu’à chaque fois que nous collectons des données, nous voulons nous assurer que les principes suivants sont respectés :

  • Nécessité
  • Transparence
  • Responsabilité
  • Respect de la vie privée
Nécessité

Nous ne collectons pas des données, « juste parce que c’est possible » ou encore « juste parce que ça serait intéressant à mesurer ». Quiconque demande à collecter des données au sein de l’équipe Firefox doit être capable de répondre à des questions telles que :

  • Est-ce que la collecte des données est nécessaire au bon fonctionnement de Firefox ? Par exemple, la vérification automatique des mises à jour doit être une donnée envoyée pour que Firefox puisse être maintenu à jour.
  • Est-ce que la collecte des données est nécessaire pour qu’une fonctionnalité dans Firefox joue correctement son rôle ? Par exemple, nous avons besoin de collecter des données pour pouvoir faire fonctionner nos suggestions de recherche.
  • Est-il nécessaire d’effectuer la mesure auprès des utilisateurs de la version finale de Firefox ? Pouvons-nous apprendre ce dont nous avons besoin via une mesure auprès des utilisateurs d’une préversion de Firefox ?
  • Avons-nous besoin de collecter des données auprès de l’ensemble des utilisateurs ou est-il suffisant de collecter les données auprès d’un échantillon ?
Transparence

La transparence chez Mozilla, cela signifie que nous partageons publiquement les détails de ce que nous collectons. Nous nous assurons aussi de pouvoir répondre de manière ouverte sur notre processus de décisions.

Les requêtes pour la collecte de données débutent à l’aide d’un ticket disponible publiquement ouvert sur Bugzilla. Le processus général relatif à la collecte de nouvelles données est le suivant : les personnes indiquent quelles sont les données qu’elles souhaiteraient collecter en fonction d’un cahier des charges. Ils font ensuite appel à un gestionnaire de données (data steward en anglais), un employé qui est en mesure de vérifier que les auteurs de ces requêtes ont suffisamment documenté publiquement leurs intentions et besoins, pour examen. Seules les requêtes ayant passé cet examen avec succès sont mises en œuvre.

La plupart des requêtes simples telles que les nouveaux éléments de télémétrie ou les tests expérimentaux sont approuvées au travers d’un simple ticket. On y vérifie la présence de détails suffisants pour pouvoir répondre aux questions de nécessité et de responsabilité en ce qui concerne les mesures suggérées. Voici un exemple d’une requête simple pour l’ajout d’une donnée dans la télémétrie.

Les requêtes plus complexes telles que celles nécessitant un nouveau mécanisme de collecte ou un changement de la politique de vie privée doivent être validées de manière plus poussée qu’une requête simple. Les gestionnaires de données ou directement les créateurs de la requête demanderont à accroître le niveau de validation lorsqu’il est établi qu’un simple examen est insuffisant. Cette validation étendue peut inclure l’ensemble ou certains des éléments suivants :

  • Analyse du respect de la vie privée : échanges sur la liste de distribution mozilla.dev.privacy et/ou avec des experts internes ou externes à Mozilla pour discuter de la fonctionnalité et de son impact sur le respect de la vie privée.
  • Vérification du respect de la politique sur les données : une évaluation effectuée par l’équipe de Mozilla responsable de la conformité pour les données pour déterminer si la requête suit les politiques et documents de Mozilla sur les données.
  • Relecture juridique : une évaluation par l’équipe responsable des questions juridiques chez Mozilla. C’est nécessaire pour tout changement des politiques/déclarations de confidentialité.
Responsabilité

Notre processus intègre un ensemble d’éléments qui nous tient pour responsables de la collecte de données que nous effectuons. Nous nous assurons qu’une personne dédiée est en mesure de suivre et de prendre la responsabilité du cahier des charges imposé. Cela implique le design et le développement nécessaire, mais aussi d’analyser les données reçues et d’en rendre compte. Les gestionnaires de données s’assurent que les questions fondamentales sur les intentions derrière les données que nous collectons et la mise en œuvre de la collecte peuvent trouver réponse et que la collecte proposée entre dans les limites d’une catégorie de données parmi celles disponibles par défaut. Ces vérifications nous permettent d’être plus confiants sur notre capacité à pouvoir expliquer et justifier à nos utilisateurs pourquoi nous avons décidé de débuter la collecte d’une donnée spécifique.

Respect de la vie privée

Nous pouvons collecter beaucoup de types de données sur votre usage de Firefox, mais nous ne les considérons pas de la même façon. Nous estimons que certains types de données sont plus inoffensifs (comme la version de Firefox que vous utilisez) que d’autres (comme les sites web que vous consultez). Nous avons divisé notre système « 4-tier » en 4 niveaux pour regrouper les données en catégories clairement définies depuis les moins sensibles jusqu’aux hautement sensibles. Vous pouvez les passer en revue ici de façon plus détaillée. Depuis que nous avons développé cette approche en 4-tier, nous travaillons à harmoniser sa formulation avec notre Politique de confidentialité et avec la section Vie privée des options ou préférences de Firefox. Vous pouvez en lire plus sur les efforts de l’équipe des affaires juridiques dans un billet de blog de mes collègues du service juridique et de la conformité.

Qu’est-ce que cela signifie pour vous ?

Nous espérons que cela signifie beaucoup et pas tant que ça en même temps. Pour Firefox, nous avons longtemps travaillé pour respecter votre vie privée et nous espérons que cette nouvelle stratégie vous apportera une compréhension plus claire des données que nous collectons et de leur importance pour nous. Nous tenons aussi à vous donner l’assurance que nous n’avons pas radicalement changé ce que nous collectons par défaut. Ainsi, tandis que vous ne pensez pas souvent aux données que vous partagez avec Mozilla, nous espérons que lorsque vous y penserez, vous vous sentirez mieux informé·e et en aurez une meilleure maîtrise.

-- Rebecca Weiss

Rebecca est en charge de l’équipe produit pour la science des données pour Firefox. Son équipe a pour but d’intégrer une approche empirique à la stratégie produit et de faire avancer les connaissances issues des données, que ce soit autour du Web ou au-delà.


Vous pouvez venir en parler avec la communauté Mozilla francophone sur ses canaux IRC. Il n’y a pas de question bête ni de sujet futile en cette matière. Vous y serez bien accueilli·e.

(Re)lire : Rendre la protection de la vie privée plus transparente, 6 sept. 2017, Marshall Erwin, Urmika Devi Shah et Michael Verdi, Open Policy & Advocacy


Traduction et relecture : Mozinet, Alpha_X, Goofy, Théo et anonymes

Crédit illustrations : Image des données avec cadenas, Blogtrepreneur, sous licence CC By 2.0