Les nouvelles technologies sur le banc d’essai

Le numérique a bel et bien fait son entrée dans le secteur immobilier. CIFI-Quarterly a demandé au Dr. Michael Mayer, expert en la matière, dans quelle mesure les processus de travail traditionnels tirent profit des nouvelles technologies.

Les termes Machine Learning, Big Data ou intelligence artificielle font aujourd’hui partie du langage marketing courant des entreprises numériques. Comment peut-on y extirper les véritables innovations?

Michael Mayer: Dans les faits, de nombreuses entreprises – de la start-up à la multinationale – mettent en avant ce trio de choc: Machine Learning, Big Data et IA. Personne ne veut passer pour un dinosaure. Mais quelle est la véritable plus-value pour nous, les clients? À l’heure actuelle, faire ses achats en ligne est évidemment simple comme bonjour. Et cela ne nécessite aucune de ces trois technologies. Dans cet exemple, il est nécessaire d’avoir une interface pratique et une base de données avec une bonne structure en arrière-plan. Autre question: les trains sont-ils plus ponctuels grâce au Big Data? La nourriture est-elle devenue plus saine? A-t-il permis de réduire le stress du quotidien? Les estimations immobilières sont-elles plus précises?

Attardons-nous sur le dernier point: ce n’est pas parce que je recueille une grande quantité de données et que j’utilise des technologies modernes que mon modèle d’estimation des biens immobiliers est plus précis. Les éléments clés sont la qualité et la pertinence des données ainsi qu’un bon SIG (système d’information géographique). Les prix des transactions sont les composants les plus importants d’une estimation immobilière automatique. Avec de tels volumes de données, on devrait plutôt parler de Smart Data et non de Big Data.

L’évaluation hédoniste est pourtant une forme primitive de Machine Learning du fait des algorithmes.

Oui, les évaluations hédonistes reposent souvent sur la régression linéaire ou la méthode des moindres carrés. Elle a été élaborée il y a plus de 200 ans entre autres par le mathématicien Johann Carl Friedrich Gauss et peut être considérée comme le point de départ du Machine Learning. Vue sous cet angle, l’évaluation hédoniste fait en effet partie du Machine Learning. Peu importe que les textes et les images doivent être reconnues à l’aide de réseaux neuronaux ou que les évaluations hédonistes soient calculées à l’aide d’une régression linéaire; les ingrédients sont toujours les mêmes: données, programmation et connaissances de spécialistes. Si on s’appuie sur différents algorithmes pour établir un calcul, cela ne représente qu’un élément d’un processus par ailleurs identique. Dans le principe, cela n’a rien de révolutionnaire.

Comment la Machine Learning s’est-il développé et pourquoi connait-on aujourd’hui une telle tendance?

Trois facteurs entrent en compte. Premièrement, la quantité quasi infinie de données disponibles sous forme électronique grâce à internet. Deuxièmement, le développement d’équipements informatiques extrêmement puissant qui permettent aujourd’hui d‘accéder à quasiment tous les clouds en quelques clics. Pour quelques francs de l’heure, il est possible de modéliser une quantité de données pour laquelle il aurait fallu des centres de données entiers quelques années auparavant. Et troisièmement, la conception et le perfectionnement des algorithmes du Machine Learning. On parle ici notamment des réseaux de neurones complexes. Ce développement porte un nom: le Deep Learning. Le Deep Learning a notamment révolutionné le traitement des images et des textes et rendra un jour possible la démocratisation des voitures autonomes.

Le Machine Learning a-t-il aussi des répercussions sur les modèles d’évaluation hédoniste?

L’avantage de la méthode hédoniste par rapport aux méthodes modernes du Machine Learning réside dans le terme «hédoniste»; il vient du grec et désigne tout ce qui apporte du plaisir ou de la joie. L’hédoniste sait jouir des plaisirs de la vie. Quelle somme dois-je dépenser pour faire construire une salle de bain supplémentaire ou un balcon plus grand afin de satisfaire mon plaisir? Les techniques de régression classiques permettent de répondre immédiatement à ces questions. En revanche, les techniques modernes du Machine Learning donnent souvent des boîtes noires dans lesquelles on intègre toutes les données. On donne ensuite une valeur à l’une d’entre elles sans aucune justification. Ceci s’avère problématique en particulier en cas d’évaluations irréalistes: pourquoi la valeur baisse-t-elle alors que la valeur au mètre carré augmente? Pourquoi l’évaluation a été modifiée de 10% lorsque la maison a été déplacée de dix mètres?
Actuellement, de nombreuses recherches sont en cours afin de mieux interpréter les modèles de boîtes noire On parvient de mieux en mieux à en tirer au moins des boîtes grises. Les techniques modernes deviendront donc aussi utiles dans les domaines où l’interprétation est capitale, par exemple en économie.

Vous êtes également co-auteur d’une étude comparant les méthodes d’estimation immobilière classiques aux méthodes de Machine Learning (neural networks). Quelles en sont les conclusions?

Dans le cadre de ce travail empirique, nous avons comparé trois méthodes classiques, parmi lesquelles la régression linéaire, avec trois techniques de modélisation modernes: les réseaux neuronaux, le Gradient Boosting et les Random Forests. La comparaison ne portait pas uniquement sur leur précision, mais également sur leur «volatilité». Voici ce que j’entends par là: souvent, les biens immobiliers ne sont pas évalués qu’au moment de leur vente. Normalement, un bien est réévalué à intervalles réguliers à l’aide des derniers modèles hédonistes. Cela peut être justifié par les réflexions sur les risques de la part du créancier. Au final, la dernière crise financière a eu lieu à cause des évaluations qui ne reflétaient plus le risque réel des produits financiers complexes.

Nous avons constaté à quel point de tels écarts peuvent en général disparaître grâce à des réévaluations. Les petits écarts sont escomptés et se justifient par les fluctuations du marché et la dépréciation due à l’âge. Pourtant, personne n’aimerait que son bien immobilier perde 10% de sa valeur d’un trimestre sur l’autre pour ensuite reprendre 10% le trimestre suivant. Notre étude a montré que les procédés modernes du Machine Learning généraient certes des résultats précis, mais avaient tendance à donner des écarts considérablement plus élevés. Dans le jargon, on parle de dilemme de la «variance d’un biais». Plus une modélisation est précise, plus sa «volatilité» est élevée. Si les modélisations hédonistes sont utilisées pour les réévaluations, alors les méthodes classiques sont intéressantes.

Y-a-t-il aussi des avantages à utiliser le Machine Learning dans le cadre des estimations immobilières?

Les réseaux de neurones en particulier sont incroyablement flexibles: ils permettent d’intégrer à l’estimation immobilière non seulement des valeurs numériques comme le nombre de chambres, mais également des images et des textes. Chose impossible avec une régression linéaire.

Comment le Big Data pourrait-il améliorer la qualité des estimations?

La Suisse est un petit pays: même si on collectait les 20 facteurs les plus importants influant sur les prix de tels que le nombre de chambres, la surface utile, l’année de construction etc. de tous les biens en Suisse, toutes ces données tiendraient dans une clé USB. Le Big Data s‘utilise plutôt dans le cadre d’un SIG solide, éventuellement de certaines applications ainsi que de données photos et vidéos.

Comment voyez-vous ces technologies évoluer dans les prochaines années? Sommes-nous juste au commencement ou en plein milieu?

A: Niels Bohr a dit: «Prediction is very difficult, especially if it’s about the future*». Pour tout de même faire une estimation: nous n’en sommes qu’aux prémices dans les domaines du Visual Computing (modélisation avec des données photos/vidéos) et du Natural Language Programming (modélisation avec des données textes/audios). Ici, les possibilités et les investissements au cours des prochaines années seront énormes. On pense par exemple à la course à la conception des voitures autonomes. Dans d’autres domaines, on arrivera peut-être bientôt à une phase de désillusion étant donné que les avantages du Machine Learning moderne et du Big Data seront considérablement moindres. Concrètement: qu’un modèle ait un taux d’erreur de 10% au lieu de 11% n’a pas d’importance pour la plupart des utilisateurs. Ils seront plus intéressés de savoir si une voiture peut conduire toute seule ou non.

*en Français: «Il est très difficile de faire des prévisions, surtout lorsqu’elles concernent l’avenir»

Observation: Cette étude peut être obtenue sur la banque de donnée «emerald insight» de l’université de Sheffield

 

Votre contact média
Michel Benedetti