Des statistiques sous le capot des voitures autonomes
L’engouement actuel pour la digitalisation rappelle les débuts de l’internet. Les utopistes et spécialistes en marketing jonglent aisément avec de nouveaux concepts technologiques, tandis que les sceptiques veulent attendre des résultats tangibles. Quoi qu’il en soit, il est important de procéder à une évaluation des risques et des chances que recèlent les nouvelles technologies et des apports qui en résultent en termes de stratégie d’affaires. Comment et dans quelle mesure cela concerne l’industrie de l’immobilier, c’est ce que CIFI-Quarterly a demandé à l’expert en science des données Michael Mayer.
Quel est l’impact de la digitalisation pour un expert en science des données?
Michael Mayer: L’image poussiéreuse de la statistique a connu un formidable coup de jeune depuis que l’algorithme de recherche de Google a conquis l’internet. Beaucoup d’innovations et de technologies issues de l’actuelle vague de digitalisation reposent avant tout sur la statistique et plus particulièrement sur la science des données. Prenez l’exemple des voitures sans conducteur: un élément clé sera la reconnaissance en temps réel de personnes et d’obstacles dans la rue. Pour cela, il faut généralement des modèles statistiques initialement élaborés à partir d’immenses banques de données d’images et de vidéos; en l’occurrence, l’on parle aussi de «réseaux neuronaux» artificiels ou bien du «deep learning» («apprentissage profond»).
Le «deep learning» est-il synonyme de «l’apprentissage automatique»?
Michael Mayer: Deep Learning n’est qu’une des multiples techniques d’apprentissage automatique. Ces dernières années, deep learning a en particulier révolutionné l’analyse des données non-structurées comme par exemple les images, les films et les textes. Les applications sont à la fois fascinantes et angoissantes: aux Etats-Unis par exemple, des applications permettent d’identifier automatiquement les clients réguliers des fast-foods pour la préparation immédiate de leur commande. Le même équipement peut aussi détecter des voleurs à l’étalage récidivistes dès leur entrée dans le magasin et de les surveiller de manière spécifique. Je vous laisse imaginer comment des régimes autoritaires pourraient utiliser – et utiliseront – de telles technologies. La dystopie d’un George Orwell n’est pas loin.
L’apprentissage automatique offre-t-il aussi d’autres applications moins futuristes?
Michael Mayer: Le filtre de spam qui est effectivement un peu moins spectaculaire et déjà disponible depuis longtemps. Il scrute le texte de chaque e-mail à la recherche d’éléments notables, notamment de mots-clés, puis le dirige vers la boîte mail appropriée en fonction d’un modèle de classification statistique. Initialement, le développement de tels modèles a nécessité de grosses banques de données d’e-mails ainsi qu’une allocation manuelle de chaque e-mail en spam ou non-spam. Entre temps, c’est des millions d’utilisateurs qui contribuent à ce travail en reportant par exemple des spams dans nos boîtes e-mail. Ainsi, les filtres de spam s’améliorent ainsi continuellement sans trop d’effort.
D’une manière générale, les outils statistiques des domaines du big data et de l’apprentissage automatique évoluent à une vitesse fulgurante. Cela sans doute dû au fait que ce ne sont pas les universités qui donnent le pas, mais des multinationales pesant des milliards comme Google ou Microsoft. Ces dernières rendent d’ailleurs une partie de leurs technologies publiques afin d’accélérer encore leur développement.
CIFI se base sur des modèles hédonistes pour l’évaluation des prix de l’immobilier. Ces modèles sont-ils encore pertinents face aux dernières évolutions technologiques?
Michael Mayer: Oui, absolument. Les modèles du CIFI reposent sur un processus de modélisation innovant et exclusif qui se déploie sur plusieurs niveaux. Une partie du processus repose par exemple sur la préparation de données et sur le calcul d’agrégats clés reflétant des situations micro ou macro régionales. Cette démarche est généralement optimisée en continu depuis 20 ans, grâce aussi à l‘utilisation de techniques statistiques modernes comme par exemple l’«apprentissage ensembliste» ou plusieurs modèles statistiques sont calculés et combinés. Et les avancées de ces nouvelles méthodes se diffusent au fil de l’eau dans les différentes applications du CIFI.
Le métier de statisticien va-t-il se transformer de manière radicale?
Michael Mayer: Le travail du statisticien consiste essentiellement à transformer les données en informations utiles. Cela restera vrai à l’avenir. Que les outils, c’est-à-dire les algorithmes et les logiciels, continuent à évoluer, cela va de soi.