Et si on montrait aux robots comment conduire une voiture ?

Les chercheurs ont conçu un système qui permet aux robots d’apprendre de manière autonome des tâches complexes à partir d’un très petit nombre de démonstrations, même imparfaites. Alors que les méthodes de pointe actuelles nécessitent au moins 100 démonstrations pour clouer une tâche spécifique, cette nouvelle méthode permet aux robots d’apprendre à partir d’une poignée de démonstrations seulement.

Des robots qui apprennent des démonstrations qui leurs sont faites

Imaginez si les robots pouvaient apprendre en regardant des démonstrations: vous pourriez montrer à un robot domestique comment faire des tâches de routine ou dresser une table. Sur le lieu de travail, vous pouvez former des robots comme de nouveaux employés, en leur montrant comment effectuer de nombreuses tâches. Sur la route, votre voiture autonome pourrait apprendre à conduire en toute sécurité en vous regardant conduire dans votre quartier.

Faisant progresser cette vision, les chercheurs de l’USC ont conçu un système qui permet aux robots d’apprendre de manière autonome des tâches complexes à partir d’un très petit nombre de démonstrations, même imparfaites. Le document, intitulé Learning from Demonstrations Using Signal Temporal Logic, a été présenté à la Conférence sur l’apprentissage robotique (CoRL), le 18 novembre.

Le système des chercheurs fonctionne en évaluant la qualité de chaque démonstration, afin qu’il apprenne des erreurs qu’il constate, ainsi que des réussites. Alors que les méthodes de pointe actuelles nécessitent au moins 100 démonstrations pour clouer une tâche spécifique, cette nouvelle méthode permet aux robots d’apprendre à partir d’une poignée de manifestations. Cela permet également aux robots d’apprendre de manière plus intuitive, la façon dont les humains apprennent les uns des autres – vous regardez quelqu’un exécuter une tâche, même imparfaitement, puis essayez vous-même. Cela n’a pas à être une démonstration «parfaite» pour que les humains glanent des connaissances en se regardant les uns les autres.

«De nombreux systèmes d’apprentissage automatique et d’apprentissage par renforcement nécessitent de grandes quantités de données et des centaines de démonstrations – vous avez besoin d’un humain pour faire des démonstrations maintes et maintes fois, ce qui n’est pas faisable», a déclaré l’auteur principal Aniruddh Puranic, un Ph.D. étudiant en informatique à l’USC Viterbi School of Engineering.

«De plus, la plupart des gens n’ont pas de connaissances en programmation pour indiquer explicitement ce que le robot doit faire, et un humain ne peut pas démontrer tout ce qu’un robot a besoin de savoir. Et si le robot rencontre quelque chose qu’il n’a pas vu auparavant? un défi majeur. « 

Apprendre des démonstrations

L’apprentissage des démonstrations devient de plus en plus populaire pour obtenir un contrôle efficace du robot politiques – qui contrôlent les mouvements du robot – pour des tâches complexes. Mais il est sensible aux imperfections dans les démonstrations et soulève également des problèmes de sécurité car les robots peuvent apprendre des actions dangereuses ou indésirables.

De plus, toutes les démonstrations ne se valent pas: certaines démonstrations sont un meilleur indicateur du comportement souhaité que d’autres et la qualité des démonstrations dépend souvent de l’expertise de l’utilisateur qui fournit les démonstrations.

Pour résoudre ces problèmes, les chercheurs ont intégré la «logique temporelle du signal» ou STL pour évaluer la qualité des démonstrations et les classer automatiquement pour créer des récompenses inhérentes.

En d’autres termes, même si certaines parties des démonstrations n’ont aucun sens en fonction des exigences logiques, en utilisant cette méthode, le robot peut toujours apprendre des parties imparfaites. D’une certaine manière, le système arrive à sa propre conclusion sur l’exactitude ou le succès d’une démonstration.

«Disons que les robots apprennent de différents types de démonstrations – cela pourrait être une démonstration, vidéos ou simulations – si je fais quelque chose de très dangereux, les approches standard feront l’une des deux choses suivantes: soit, elles l’ignoreront complètement, ou pire encore, le robot apprendra la mauvaise chose », a déclaré le co- auteur Stefanos Nikolaidis, professeur adjoint d’informatique à l’USC Viterbi.

« En revanche, de manière très intelligente, ce travail utilise un raisonnement de bon sens sous forme de logique pour comprendre quelles parties de la démonstration sont bonnes et quelles parties ne le sont pas. En substance, c’est exactement ce que font aussi les humains. »

Prenons, par exemple, une démonstration de conduite où quelqu’un saute un panneau d’arrêt. Cela serait classé plus bas par le système qu’une démonstration d’un bon conducteur. Mais, si au cours de cette démonstration, le conducteur fait quelque chose d’intelligent – par exemple, applique ses freins pour éviter une collision – le robot apprendra toujours de cette action intelligente.

S’adapter aux préférences humaines

La logique temporelle du signal est un langage symbolique mathématique expressif qui permet un raisonnement robotique sur les résultats actuels et futurs. Alors que les recherches précédentes dans ce domaine ont utilisé la «logique temporelle linéaire», la STL est préférable dans ce cas, a déclaré Jyo Deshmukh, ancien ingénieur de Toyota et professeur adjoint d’informatique à l’USC Viterbi.

«Lorsque nous entrons dans le monde des systèmes cyber-physiques, comme les robots et les voitures autonomes, où le temps est crucial, la logique temporelle linéaire devient un peu lourde, car elle raisonne sur des séquences de valeurs vraies / fausses pour les variables, tandis que STL permet le raisonnement sur les signaux physiques. « 

Puranic, qui est conseillé par Deshmukh, a eu l’idée après avoir suivi un cours de robotique pratique avec Nikolaidis, qui a travaillé sur le développement de robots pour apprendre des vidéos YouTube. Le trio a décidé de le tester. Tous les trois se sont dits surpris par l’ampleur du succès du système et les professeurs remercient Puranic pour son travail acharné.

« Par rapport à un algorithme de pointe, largement utilisé dans de nombreuses applications robotiques, vous voyez une différence d’ordre de grandeur dans le nombre de démonstrations nécessaires », a déclaré Nikolaidis.

Le système a été testé à l’aide d’un simulateur de jeu de style Minecraft, mais les chercheurs ont déclaré que le système pourrait également apprendre des simulateurs de conduite et même des vidéos. Ensuite, les chercheurs espèrent l’essayer sur de vrais robots. Ils ont dit que cette approche est bien adaptée pour les applications où les cartes sont connues à l’avance mais où il y a des obstacles dynamiques sur la carte: des robots dans les environnements domestiques, des entrepôts ou même des rovers d’exploration spatiale.

« Si nous voulons que les robots soient de bons coéquipiers et aident les gens, ils doivent d’abord apprendre et s’adapter très efficacement aux préférences humaines », a déclaré Nikolaidis. « Notre méthode fournit cela. »

« Je suis ravi d’intégrer cette approche dans les systèmes robotiques pour les aider à apprendre efficacement des démonstrations, mais aussi à aider efficacement les coéquipiers humains dans une tâche collaborative. »

SEO AGENCE est une agence digitale à Lille.

Comprendre la transformation numérique

L’Agence SEO a pu s’entretenir avec Karen Christensen, Research Scientist au Centre for Information Systems Research à MIT’s Sloan School of Management. Nous avons échangé sur la transformation numérique.

Vous avez dit que la transformation numérique n’était en fait pas une question de technologie. S’il vous plaît, expliquez.

C’est vraiment une question de changement – et la technologie n’est qu’un aspect de ce changement. Avant Internet, les entreprises opéraient principalement dans un monde physique, mais aujourd’hui, toutes les industries évoluent vers un monde d’espace numérique. Chaque organisation doit examiner comment elle se déplacera d’un endroit à l’autre et impliquera ses clients numériquement. Cela exigera de nouveaux types de compétences, de ressources et de capacités. En fin de compte, la question n’est pas: «De quel type de technologie avons-nous besoin?», Mais «En quoi notre entreprise est-elle formidable et comment pouvons-nous utiliser le numérique pour l’optimiser?»

Vous avez constaté que la perturbation numérique se décline en trois variétés. Veuillez les décrire.

Le premier type de perturbation se produit lorsqu’un nouvel entrant – généralement une start-up comme Uber ou Airbnb – entre dans un espace de marché existant et propose une nouvelle proposition de valeur passionnante. Dans le secteur bancaire, par exemple, nous voyons des start-up fintech s’en prendre à certains aspects des bénéfices des grandes banques. En ce moment, ils s’attaquent vraiment aux prêts, qui sont particulièrement rentables pour les banques.

La deuxième forme de perturbation vient d’un concurrent traditionnel au sein de votre industrie, mais cette organisation change de modèle commercial pour devenir un concurrent beaucoup plus redoutable. Par exemple, Nordstrom est passé du statut de grand magasin traditionnel à une activité omnicanale attrayante, combinant le meilleur du lieu (transactions tangibles, basées sur le produit, orientées client) et de l’espace (immatériel, basé sur le service et orienté vers l’expérience client) . Les sociétés de banque, d’assurance, de vente au détail et d’énergie ont toutes du mal à trouver le mélange parfait de lieu et d’espace.

La troisième forme de perturbation consiste à franchir les frontières de l’industrie. C’est ce qui se passe lorsque les challengers viennent complètement de l’extérieur de votre secteur. Cette forme de perturbation est la plus difficile à prévoir. Par exemple, pensez au consortium d’Amazon, JPMorgan Chase et Berkshire Hathaway qui tente de comprendre ce qu’il peut faire dans le domaine de la santé. Ce ne sont pas des entreprises de soins de santé, mais ensemble, elles ont des capacités très fortes et elles pensent qu’elles pourraient tout simplement être en mesure de faire quelque chose pour améliorer les soins de santé aux États-Unis. Les gens ont été très surpris quand ils ont annoncé sur quoi ils allaient se concentrer.

Parlez-nous de votre Digital Business Model Framework (DBM).

Nos recherches montrent que la numérisation oblige les entreprises à modifier leurs modèles commerciaux selon deux dimensions clés. Premièrement, ils s’orientent vers une meilleure compréhension des clients, y compris leurs besoins et leurs événements de la vie. Il ne s’agit plus uniquement de données démographiques ou d’historique d’achats, mais quelles sont leurs motivations à acheter et quels types de problèmes tentent-ils de résoudre?

La deuxième dimension clé consiste à passer d’une orientation de chaîne de valeur contrôlée à une orientation réseau, ou à un réseau de relations. Cela implique de reconnaître que vous n’êtes peut-être pas capable de fournir tout ce dont vos clients ont besoin, et que vous pouvez ajouter de la valeur en vous associant à d’autres qui peuvent fournir des services complémentaires. Ce sont les deux dimensions clés de la «création de l’entreprise de nouvelle génération» – et si vous les rassemblez dans une matrice standard deux par deux, vous obtenez quatre modèles commerciaux.

Veuillez décrire ces quatre modèles commerciaux.

Le premier est le fournisseur, et il s’agit d’un modèle commercial traditionnel où un producteur vend par l’intermédiaire d’autres entreprises. Par exemple, les téléviseurs fabriqués par des fournisseurs comme Sony et LG, qui sont vendus via un détaillant comme Best Buy; ou des entreprises qui vendent des assurances via des agents indépendants (par exemple, Chubb Group). Les entreprises de ce quadrant ont, au mieux, une connaissance partielle de leur client final et opèrent généralement dans la chaîne de valeur d’une autre entreprise, souvent plus puissante. Ce modèle ne va pas disparaître, mais à mesure que les entreprises continuent de numériser, les fournisseurs risquent de perdre plus de pouvoir et de subir des pressions pour réduire continuellement leurs prix – peut-être accélérer la consolidation de l’industrie.

Le second est l’Omni-Channel. Ce sont des entreprises qui offrent aux clients un accès à leurs produits sur plusieurs canaux, y compris des canaux physiques et numériques, offrant un plus grand choix et une expérience transparente. Les grandes entreprises omnicanales comme Walmart et les grandes banques contrôlent une chaîne de valeur intégrée qui offre des expériences client multi-produits et multi-canaux pour faire face aux événements de la vie. L’enjeu pour ces entreprises est de remonter plus haut l’axe vertical du DBM, en agissant sur une meilleure connaissance des clients et de leurs objectifs et événements de la vie.

Le troisième modèle est le producteur modulaire. Ce sont des entreprises qui fournissent des produits ou services «plug-and-play» qui peuvent s’adapter à un nombre illimité d’écosystèmes. Pour survivre, ils doivent être l’un des meilleurs producteurs de leur activité principale. Par exemple, PayPal peut fonctionner dans pratiquement n’importe quel écosystème, car il est «indépendant du matériel», mobile et basé sur une plate-forme. Bien qu’il puisse y avoir de nombreux producteurs dans une industrie, généralement seuls les trois ou quatre premiers réalisent des bénéfices importants, tandis que les autres ont du mal, car il s’agit en fin de compte d’une entreprise de matières premières.

Enfin, il existe les moteurs d’écosystème, qui établissent un écosystème numérique – un réseau coordonné d’entreprises, d’appareils et de clients qui crée de la valeur pour tous les participants. Ce modèle a une croissance des revenus et des marges bénéficiaires nettes plus élevées que les autres, et sans surprise, c’est le modèle commercial le plus difficile à réaliser. Les écosystèmes sont particulièrement puissants dans le commerce de détail (par exemple, Amazon), mais la santé (par exemple, Aetna), le divertissement en ligne (par exemple, Netflix) et la gestion de patrimoine (par exemple, Fidelity) ont tous de puissants moteurs d’écosystème. À l’avenir, les clients de tous types préféreront de plus en plus l’efficacité d’un moteur d’écosystème numérique «incontournable» pour effectuer des transactions dans tous les domaines.

Chaque entreprise doit-elle choisir l’un des quatre modèles?

Ils doivent en choisir au moins un, mais en fait, la plupart des grandes entreprises englobent plus d’un ces modèles. Par exemple, non seulement Amazon est un pilote d’écosystème, mais il fournit également des services à d’autres entreprises, y compris l’exécution (il gère l’entreposage, l’emballage et l’expédition d’un milliard d’articles) et la capacité technologique (via Amazon Web Services), ce qui en fait un producteur modulaire. ainsi que.

La plupart des banques opèrent dans plusieurs quadrants – et souvent dans les quatre. La grande banque typique agit en tant que fournisseur, vendant des hypothèques et des produits d’investissement. La plupart s’efforcent également d’améliorer leurs offres omnicanales en réinventant la succursale pour qu’elle soit davantage un lieu d’acquisition de clients, de vente et de conseil, la plupart des transactions étant effectuées numériquement. Ces mêmes banques fonctionnent comme des producteurs modulaires, offrant divers services, y compris des paiements et des devises à de nombreuses autres entreprises. Enfin, de nombreuses banques ont fait des incursions dans le modèle de moteur d’écosystème en offrant des services plus complets pour les événements de la vie tels que l’achat d’une maison, la possession d’une voiture ou la préparation de la retraite.

Parlez un peu de la façon dont un Les entreprises omnicanales comme Walmart interagissent avec un moteur d’écosystème comme Amazon.

Voici un exemple: mon collègue a récemment commandé des charbons pour barbecue sur Amazon, sans remarquer qui était le vendeur; et, quelques jours plus tard, le colis est arrivé dans une boîte de Walmart.com. C’est la puissance d’un excellent écosystème, et cela donne un aperçu de la façon dont Walmart est à la fois en concurrence et en partenariat avec Amazon en fournissant des produits en tant que producteur modulaire au modèle de pilote d’écosystème d’Amazon.

Vous recommandez aux entreprises de faire un effort pour passer directement à votre infrastructure DBM. Pourquoi est-ce si important?

Les entreprises doivent se concentrer sur deux choses: en apprendre davantage sur leurs clients et modifier la conception de leur entreprise pour mettre l’accent sur davantage de partenariats et des frontières plus poreuses. À l’heure actuelle, la plupart des entreprises se trouvent du côté gauche de notre cadre. Parmi les grandes entreprises que nous avons étudiées, 46 pour cent étaient des fournisseurs, 24 pour cent étaient omnicanal, 18 pour cent étaient des producteurs modulaires et 12 pour cent étaient moteurs de l’écosystème.

Le commerce de détail et les services informatiques ont le pourcentage le plus élevé d’écosystèmes, tandis que les industries de fabrication et de services sont encore au début de leur progression et de leur droite sur le cadre. Il est intéressant de noter que les petites entreprises (dont les revenus sont inférieurs à 1 milliard de dollars) sont déjà plus haut et à droite de notre cadre que les grandes entreprises, avec 31% dans le modèle de moteur d’écosystème et 36% dans le modèle omnicanal.

Pour vous déplacer vers le haut et vers la droite, vous pouvez commencer par améliorer la collecte, la consolidation et la génération d’informations sur vos clients, ce qui se traduit par une meilleure expérience client et des offres plus ciblées et réussies. Ensuite, vous pouvez commencer à vous déplacer vers la droite en passant de la fourniture de services directement au client à la participation à un réseau de relations qui fournissent un ensemble plus large de services, via des partenaires.

La principale compagnie d’assurance USAA l’a fait avec brio en aidant ses clients à trouver la voiture parfaite, mais ils ne se sont pas arrêtés là. Ils ont lié de personnes aux concessionnaires automobiles avec la voiture souhaitée en stock, les a aidés à négocier le prix, fourni le financement et parfois facilité la livraison. Les économies moyennes pour un membre de l’USAA sont de 3 385 $ sur le prix de détail recommandé. C’est un excellent exemple de la façon dont un modèle numérique peut créer de la valeur pour les gens.

Vous avez identifié trois sources clés d’avantage concurrentiel dans un environnement commercial numérique: le contenu, l’expérience client et les plateformes. Veuillez décrire chacun d’eux.

Le contenu est plus que de simples reportages. C’est tout ce que vous fournissez à votre client. Si vous vendez des produits physiques, cela relève du contenu, tout comme les informations. Avec Amazon, une partie de leur contenu est le produit lui-même, et une partie de celui-ci comprend toutes les informations autour du produit, comme les manuels d’utilisation et les avis clients. Tout ce que le client consomme, c’est du contenu.

L’expérience client est tout ce qui entoure votre contenu pour rendre les relations avec votre entreprise un plaisir. Bien faire cela nécessite surveiller en permanence ce que font les clients et ce qu’ils disent vouloir. Cela signifie investir dans de bonnes interfaces utilisateur et créer des opportunités de collaboration avec les clients.

Enfin, votre plateforme est la méthode par laquelle vous fournissez votre contenu aux clients. Les entreprises doivent développer et réutiliser – c’est-à-dire partager au sein de l’entreprise, plutôt que réinventer pour chaque domaine – des plateformes numérisées. Sans plates-formes, les unités informatiques des entreprises pourraient mettre en œuvre une nouvelle solution en réponse à tous les besoins de l’entreprise – créant un labyrinthe de systèmes qui répondent aux besoins actuels mais ne sont pas à l’échelle de l’entreprise. Pire encore, l’expérience client en souffre car le client bénéficie d’une expérience fragmentée et basée sur les produits plutôt que d’une expérience unifiée et multi-produits. Pensez à votre expérience de banque en ligne aujourd’hui, où vous pouvez voir tous vos comptes en un seul endroit – et à la façon dont vous receviez des relevés papier individuels pour chaque compte.

Six questions essentielles

  1. Quelle est la menace numérique – et opportunité?
  2. Quel modèle commercial convient le mieux à l’avenir de votre entreprise?
  3. Quel est votre avantage concurrentiel numérique (contenu, expérience client ou plateforme)?
  4. Comment allez-vous vous connecter en utilisant le mobile et l’Internet des objets?
  5. Avez-vous les capacités cruciales pour réinventer l’entreprise?
  6. Avez-vous le leadership nécessaire pour réaliser votre transformation? Un conseil de départ pour les dirigeants? Étant donné le niveau de turbulence causé par la perturbation numérique de toutes les variétés, y remédier est devenu un impératif commercial. Il est temps pour les équipes dirigeantes d’évaluer les menaces, de comprendre les opportunités et de commencer à créer de nouvelles options pour l’avenir.

SEO Agence – est une agence SEO à Lille

Google organise une conférence digitale de 3 jours

Google prévoit une conférence numérique de trois jours qui se déroulera du 30 juin au 2 juillet. Google prévoit un événement numérique en direct se déroulant sur trois jours, qui s’adresse aux développeurs et propose également des sessions spécifiques à la recherche.

La conférence «Web.dev Live» de Google se tient du 30 juin au 2 juillet et semble être entièrement gratuite.

L’objectif de la conférence est d’aider les gens à rester connectés, informés et à jour avec les techniques Web modernes.

Une page de destination se lit comme suit:

«Ce sont des temps sans précédent, avec des gens du monde entier qui cherchent à rester connectés et informés. Le Web joue un rôle spécial ici, et nous sommes fiers de voir comment la communauté s’est renforcée.

Rejoignez l’équipe de la plate-forme Web de Google, dans le confort de votre foyer, pour célébrer les actions de notre communauté, apprendre les techniques Web modernes et vous connecter.  »

Trois jours, des dizaines de sessions
La conférence se déroule sur trois jours et chaque jour aura lieu dans un fuseau horaire différent.

Un «jour» de la conférence ne dure que trois heures, mais dans ce bloc de temps, il y a environ une douzaine de sessions.

Cela signifie que chaque session durera entre 10 et 20 minutes, y compris une période de questions et réponses.

Sessions spécifiques à la recherche
Comme mentionné, la conférence s’adresse aux développeurs en ce qui concerne le contenu de la session.

Cependant, il existe certaines sessions spécifiquement liées au référencement.

Le mardi 30 juin, Martin Splitt de Google présentera deux sessions consécutives sur le référencement JavaScript:

Débogage des problèmes de référencement JavaScript
Implémentation de données structurées avec JavaScript
Aucun moment précis n’a été prévu pour le déroulement de ces sessions, mais ce sont les deux dernières sessions de la journée.

La journée commence à 12 h 00 HNE, donc si vous vous présentez pendant au moins 14 h 15 HNE, vous devriez pouvoir assister à ces sessions.

Il n’y a pas de sessions spécifiques à la recherche ayant lieu les deux autres jours de la conférence, mais elles peuvent être intéressantes si vous effectuez un développement Web.

Comment participer
La participation à la conférence Web.dev Live est entièrement gratuite, il vous suffit de vous inscrire sur la page d’accueil ici.