Pranav Mistry

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Pranav Mistry

alt=Description de cette image, également commentée ci-après

Pranav Mistry

Naissance 28 octobre 1981 (33 ans)
Palanpur (Nord du Gujarat)
Profession

Chef de l'équipe de recherche Think Tank et directeur de recherche chez Samsung recherche Amérique.

anciennement chercheur au MIT,
dans le groupe « Fluid Interfaces Group » au Media Lab, depuis 2008

Compléments

Il est connu comme l'inventeur d'un projet « SixthSense »
(Sixth Sense pour les anglophones)

Pranav Mistry, né le 28 octobre 1981 à Palanpur, dans le nord du Gujarat en Inde, est un chercheur (ingénieur, inventeur et designer indien.

Il vit et travaille aujourd'hui aux États-Unis en tant que directeur de recherche de Samsung research America et chef de l'équipe think tank[1]

Il est titulaire d'un doctorat réalisé au Media lab du MIT.

Domaines d'étude[modifier | modifier le code]

Pranav Mistry s'est spécialisé en informatique ubiquitaire et dans certaines approches transdisciplinaires de l'informatique.

Il se présente lui-même comme « Desigineer» (néologisme associant les notions de design et d'ingénierie) [2]. Il a travaillé dans un laboratoire orienté vers le travail d'interfaçage fluide et intuitif du « monde digital » de la société de l'information avec le monde physique qui nous entoure.

Il est considéré par beaucoup[Qui ?] comme l'un des innovateurs les plus doués de sa génération dans le domaine des applications informatiques de ce domaine.

Pranav Mistry explore en particulier les interactions permises par l'informatique ubiquitaire, la reconnaissance de gestes, la vision artificielle (« Machine vision »), les interfaces tangibles voire des éléments de Robotique.

Il utilise l'AI (intelligence artificielle), pour augmenter la réalité.

L'intelligence collective ou collaborative est un de ses centres d'intérêt.

Il s'est surtout fait connaitre[3],[4] pour une invention (ordinateur et interface dématérialisés) dite « SixthSense » ("6e sens" en français), parfois aussi dénommée WUW (pour « Wear Ur World » [5]).

Philosophie[modifier | modifier le code]

À la fois intéressé par le design, l'art, l'architecture, la technologie et la psychologie ou le Web sémantique, il explique sur sa page personnelle[6] qu'il « aime voir la technologie du point de vue design et vice-versa »".
Il cite "[7] Hiroshi Ishii selon qui « Nous vivons entre deux mondes : notre environnement physique et le cyberespace. En dépit de notre double citoyenneté, l'absence de raccords sans soudure entre ces existences parallèles laisse un grand fossé entre le monde des bits numériques et des atomes. À l'heure actuelle, nous sommes déchirés entre ces espaces parallèles, mais disjoints » [8]". Mistry cherche à concrètement rapprocher ces deux mondes.

  • Une constante de son travail est la recherche de solutions créatives et innovantes, pratiques et peu coûteuses visant à intégrer, par des moyens simples, le numérique dans notre environnement quotidien, pour faciliter la vie de tous et chacun.
    Pour ce faire, il associe souvent des outils informatiques banalisés ou facile à trouver dans le commerce, mais en leur donnant de nouvelles fonctions. Ces outils permettent de faire interagir et rétroagir l'information numérique (captée ou créée) avec le monde réel et le comportement et la gestuelle humaine (Gestuelle des doigts et des mains, communication non verbale…). C'est un des chercheurs qui travaillent à créer une "réalité augmentée", au service de l'Homme.
  • Avec d'autres informaticiens ou « info-média-designers » de sa génération, il dit vouloir aussi réduire la fracture numérique, en diminuant le coût des outils, mais aussi en les rendant plus ergonomiques et proche de la gestuelle humaine naturelle. Il cherche en effet à rendre l'informatique plus transparente, au service des besoins des humains ; "ce n’est pas l’informatique qui nous intéresse, c’est l’information".
  • Il est également connu et apprécié pour le fait qu'il a annoncé qu'il offrirait les résultats de son travail (innovations matérielles et logicielles) à tous, en licence libre et open-source, dans une logique collaborative et de partage.
    Plusieurs vidéos présentant son projet sont également disponibles en licence Creative Commons[9].

Éléments de biographie[modifier | modifier le code]

  • Fils d'architecte, Pranav Mistry s'est formé à l'IIT Bombay puis à l'université de l'État du Gujarat (Gujarat University) en Inde.
  • Il a brièvement travaillé avec Microsoft, comme chercheur sur UNIX
  • Puis il s'est fait connaître dans le monde entier, pour avoir inventé, avec des moyens simples (rouleaux de souris, webcam, microphone de webcam, mini vidéo-projecteur…) de nouveaux concepts permettant d'élargir les fonctions d'ordinateurs et d'objets de la vie courante, en les faisant interagir, entre eux, et avec l'environnement et les personnes.
    Durant sa vie étudiante, il a inventé les « Quickies » et divers outils (décrits ci-dessous).
    Il a surtout élaboré et testé un projet considéré comme une révolution par certains, d'ordinateur dit "SixthSense" ("6e sens").
  • Il est depuis 2008 assistant-chercheur et thésard, membre du « Fluid interface group » [10] et de 2006 à 2008 il a été l'Ambient Intelligence Group laboratoire Media Lab du MIT (Massachusetts Institute of Technology) à Cambridge.

Cursus scolaire[modifier | modifier le code]

  • 2006 ; Maitrise en science (Master of Science) au MIT Media Lab, Massachusetts Institute of Technology ; Media Arts and Sciences ; MIT ; CPA 4.9/5.0
  • 2003-2005 ; Master en Design (Master of Design) obtenu à l'IDC (IIT Bombay) ; Industrial Design Centre, Indian Institute of Technology, Bombay ; CPA 4.9/5.0
  • 1999 à 2003 ; Bachelier en ingénierie informatique au « Nirma Institute Of Technology », à Ahmedabad ; CPA 4.7/5.0

Les « Quickies »[modifier | modifier le code]

Pranav Mistry a développé un équivalent numérique "intelligent" et "augmenté" du Post-it-papier développés par 3M dans les années 1980, tout en conservant leur côté simple et pratique. Il les a appelé "Quickies" [11],[12]. Différents types d'interface permettent de directement lier la classique note manuscrite au monde numérique (téléphone mobile, agenda numérique, liste de tâches, logiciels de courriels et clients de messagerie). Ces notes peuvent être classées ou retrouvées ou se faire rappeler "au bon moment" (envoi de messages « mail » ou « texto ») par les moyens et logiciels propres au monde numérique [7] et en particulier par l'intelligence artificielle associée au traitement du langage naturel, à la RFID et aux technologies de reconnaissance de texte manuscrit. Ainsi les quickies savent copier dans le carnet d'adresse de l'ordinateur un n° de téléphone écrit à la main sur le "post-it", puis l'appeler à la date indiquée, ou rappeler (par un texto ou message vocal synthétique) à la personne qui l'a écrit de ne pas oublier d'acheter du dentifrice (alors qu'on passe à proximité d'un supermarché) et de ne pas oublier le prochain rendez-vous pris il y a 6 mois avec l'oculiste.

Le texte du post-it est traité à l'aide d'un moteur de reconnaissance de caractère, puis par un logiciel sémantique qui cherche à en comprendre le sens (grâce à des outils d'IA, ConceptNet et à la PNL) et à le relier à d'autres informations qui rendent la base de donnée "contextuellement riche" et aide le système à catégoriser les notes. Le système peut ensuite utiliser sa "connaissance des intentions de l'utilisateur", le contenu et le contexte de la note pour envoyer à l'utilisateur ou à un destinataire indiqué ou suggéré par la note des rappels, des alertes, ou des informations "juste à temps".

Quand un "post-it papier" est muni d'une puce ou étiquette RFID ou associé à une telle puce, si ce post-it est collé par exemple dans un livre, il est également "trouvable" dans le bureau, la bibliothèque, la voiture ou le grenier… et l'ordinateur se souvient de ce qu'il contient. Il peut alors suggérer des choses et induire une situation de "sérendipité".

Pranav Mistry a mis au point un prototype fonctionnel (matériel et logiciel) de quickies avant de le tester pour de nombreux usages avec des usagers différents et en situation différentes (maison, bureau ou autre lieu de travail).

Dessiner sans support[modifier | modifier le code]

Pranav Mistry a travaillé avec Kayato Sekiya sur une interface dite « Inktuitive[13] » reliant un ordinateur avec logiciel de dessin 3D à un stylo repérable dans l'espace via une caméra infrarouge, et permettant de facilement (et intuitivement) de dessiner et « extruder » des formes en 3D temps réel devant l'écran, sans tablette graphique, simplement en déplaçant le « crayon » dans l'espace (Le crayon est repéré par le système via une LED infrarouge, un émetteur et un récepteur d'ultrasons). Les possibilités permises par le dessin sur papier sont ici « augmentées».

TaPuMa (pour TAngible Public Map)[modifier | modifier le code]

TaPuMa [14],[15],[16] est un autre des projets visant à connecter le cyber espace avec le monde physique de la vie quotidienne. C'est encore une application basée sur l'idée d'utiliser les objets ou surfaces qui nous entourent comme interface avec le monde informationnel.
Plus précisément, TaPuMa est une carte publique qui se présente comme celles qu'on peut trouver dans les villes, métros, gares, aéroports, etc. Mais à la différence des cartes classiques inertes et muettes, le prototype de TaPuMa était en 2006 doté d'un système de reconnaissance de certains objets (munis d'étiquette RFID), et d'éléments simples d'intelligence artificielle.
par exemple, en posant un paquet de cigarette sur la carte, celle-ci affiche les lieux fumeurs, en posant un ticket de métro, elle affiche le plan du métro, etc.

Une telle carte peut théoriquement contenir de très nombreuses couches d'informations géoréférencées ou non (toutes celles qui sont déjà accessibles via google earth par exemple).
Une partie de ces informations (via internet ou d'autres capteurs) sont automatiquement mises à jour et disponibles en quasi-temps réel, mais une autre partie des informations peut théoriquement être insérée dans le système par les usagers eux-mêmes. L'équipe qui travaillait sur ce projet au MIT prévoyait d'étendre la capacité du système en matière de reconnaissance de forme et de sens, et d'interactivité [14].
À terme ce type de carte pourrait permettre de trouver des personnes, des objets, des lieux, des évènements (éventuellement commentés) dans notre environnement.

Projet « 6e sens »[modifier | modifier le code]

Article détaillé : SixthSense.

Ce projet (en cours de développement) d'ordinateur ubiquitaire et dématérialisé (parfois aussi appelé WUW - Wear Ur World) vise à construire un système incluant des objets de l'environnement quotidien, tenant lieu d'ordinateur quasi dématérialisé, qu'on emporte avec soi et où tout objet en devient support possible. Il est pour l'instant commandé par gestes simples, via des « capteurs » qui repèrent des points de repère (colorés en rouge, jaune, bleu et vert) apposés sur le bout de 4 des doigts de l'utilisateur.

Abandonnant la dépendance au clavier, à la souris et à l'écran et même au Poste de travail physique, P Mistry associe entre eux, une webcam, un mini-vidéoprojecteur et un téléphone mobile. Il les a doté d'interfaces d'échanges et de capacités d'analyse d'image et de mouvements.
Il a ainsi déconstruit puis reconstruit le concept d'ordinateur individuel, en partant des besoins et de nos compétences gestuelles. Selon son inventeur ce système doit encore être miniaturisé et allégé, mais à terme il pourrait être disponible pour un prix équivalent à celui d'un téléphone mobile.

« TellUs »[modifier | modifier le code]

TellUs est un outil utilisable pour l'éveil des enfants, incluant une réalité "augmentée" pour les objets présentés comme personnages d'une maison.

Projet « 3e œil » (« ThirdEye »)[modifier | modifier le code]

Ce projet développé avec Pattie Maes vise[17],[18] à produire et tester des lunettes pouvant afficher plusieurs informations différentes sur un même écran (le verre des lunettes) (par exemple pour un téléspectateur, qui pourrait voir les sous-titre d'un film dans sa langue, alors que son voisin les voit dans une autre langue, dans ses propres lunettes. Un panneau d'affichage public pourrait être "lu" en chinois par un Chinois et au même moment en français par un Français. Dans un jeu multijoueur, devant un même écran, chaque joueur pourrait voir des informations différentes, alors que deux personnes différentes pourraient regarder deux émissions différentes sur le même écran. Un écran ou un panneau d'affichage pourrait afficher des informations uniquement pour des personnes qui seraient concernées.
On peut penser qu'avec les lunettes 3D développées pour la 3D virtuelle sera également possible.

Critiques, limites et esquisses de réponses[modifier | modifier le code]

  • Pranav Mistry et l'équipe dans laquelle il travaille sont conscients qu'un mauvais usage de ces techniques peut aussi générer des effets pervers. Mis au service d'une dictature ou de personnes mal intentionnées, ces outils faciliteraient le totalitarisme, l'espionnage, etc. La communauté des logiciels libre considère souvent que l'open-source associé à des moyens techniques simples tels que ceux que propose Mistry est également un garde-fou contre ce genre de dérive, ces outils pouvant peut-être encore plus efficacement être utilisés contre les pouvoirs totalitaires. Mistry reconnaît qu'un tel changement de paradigme conduit à poser des questions nouvelles, que les commissions d'éthique et liberté, de même que les prospectivistes commencent à étudier.
  • L'informatique est de plus en plus consommatrice d'électricité et génère une pollution en amont lors de la fabrication des produits et en aval via les "déchets électroniques". Des incertitudes pèsent encore sur l'innocuité du smog électromagnétique pour l'homme ou d'autres espèces.
  • L'intelligence artificielle, bien utilisée, devrait aussi permettre d'optimiser les processus et les ressources.
    Pranav Mistry a quand il était étudiant développé un projet " SunFlower " qui est un système électronique" capable - à l'image d'un tournesol – de suivre la course du soleil. Il a été utilisé par son institut pour guider des panneaux solaires afin d'en optimiser le rendement, et aussi comme dispositif d'information météorologique. Ici encore la logique collaborative pourrait peut-être amener des solutions innovantes.

Perspectives, prospective[modifier | modifier le code]

D'autres chercheurs du MIT ou d'ailleurs, ont également développé des outils proches de ceux de Mistry ou complémentaires, avec le même esprit d'utilisation de matériels déjà disponibles et peu coûteux (par exemple pour la localisation globale (de la géolocalisation satellitale à la localisation par étiquettes RFID), accessible à un plus grand nombre de personnes dans le monde. Ils y associent souvent des innovations telles qu'écrans tactiles, écrans souples logiciels de détection des gestes, formes ou visages, de reconnaissance d'images, qui sont eux-mêmes dopés par la puissance de calcul aujourd'hui permise par les progrès de l'informatique. Cette génération de chercheurs estime qu'au lieu de produire toujours plus de périphériques mangeurs de temps, d'espace et d'énergie, il est déjà possible d'interagir avec le monde du numérique, éventuellement via nos vêtements, montres, stylos, meubles et immeubles.

Ceci élargit la gamme des possibles. Il est de plus en plus facile de faire communiquer des gens avec des objets, et inversement, et des objets entre eux, qu'ils soient proches ou distants. Il devient possible de localiser les objets et les personnes dans notre voisinage, avec des outils et concepts encore considérés comme relevant de la science-fiction au début des années 2000.

Certains de ces outils pourraient être couplés avec les inventions de Mistry, dont par exemple ;

  • les systèmes inventés par Johnny Lee à partir d'éléments de contrôleur jeux vidéo (détecteur de mouvement de type Wiimote contenant un Accéléromètre et une caméra infrarouge, comme on en trouve dans celui de la Wii de Nintendo (Camera 1024x768). Ce matériel a permis à Johnny Lee dès 2007 de transformer un écran d'ordinateur en tablette graphique, ou de créer un « tableau blanc interactif » pour quelques dizaines de dollars, au lieu de 2000 à 3000 dollars que coûtaient alors les tableaux commercialisés.
    Johnny Lee a aussi inventé une paire de lunettes équipée de deux diodes (infra-rouge) permettant à l'ordinateur de situer la position de la tête de l'utilisateur dans l'espace, et de produire à l'écran un effet de vision 3D[19],[20]. Il a également mis le logiciel de base en open-source et téléchargement gratuit sur son site (téléchargé un demi-million de fois en quelques mois).
  • le système de gestion d'images développé par Blaise Aguera y Arcas permettant de parcourir des collections d'images (ou de cartes, images satellitales, etc.) collectées sur le net, et automatiquement reliées entre elles, avec une méta-information croissante qui les enrichit (via par exemple les tags déposés par les internautes à partir de bases comme Flickr ou Wikimedia commons) [21]
  • Ces innovations pourraient également à terme se fondre dans une écodomotique urbaine ouverte, en s'intégrant dans des approches de type architecture open-source comme celle que propose Cameron sinclair[22].

Brevets[modifier | modifier le code]

En 2006, P. Mistry a déposé 7 brevets :

  • Digital user interface for inputting Indic scripts (US 2007/0174771) (167/DEL/2006)
  • Radio frequency control of computing system (1416/DEL/2006)
  • Start menu display model (1417/DEL/2006)
  • Multi-mode multimedia device and computing system (WO/2007/124083) (1418/DEL/2006)
  • Task-oriented start menu (1419/DEL/2006)
  • Hardware control initiated task switching (1420/DEL/2006)
  • Single hardware control initiated switching between application and utilities (1422/DEL/2006)

Bibliographie[modifier | modifier le code]

Publications personnelles[modifier | modifier le code]

  • (en) P. Mistry, P. Maes. SixthSense – A Wearable Gestural Interface. To be appeared in SIGGRAPH Asia 2009, Sketch. Yokohama, Japan. 2009
  • (en) P. Mistry, P. Maes. SixthSense – A Wearable Gestural Interface. To be appeared in SIGGRAPH Asia 2009, Emerging Technologies. Yokohama, Japan. 2009
  • (en) P. Mistry, P. Maes. Augmenting Sticky Notes as an I/O Interface. In the Proceedings of 13th International Conference on Human-Computer Interaction (HCII2009). San Diego, USA. 2009 (Invited Paper)
  • (en) P. Mistry, P. Maes, L. Chang. WUW - Wear Ur World - A Wearable Gestural Interface. In the ACM CHI2009 extended abstracts on human factors in computing systems. Boston, USA. 2009
  • (en) P. Mistry. Quickies: sticky Notes of the 21st Century. In the ACM CHI2009, Video Showcase. Boston, USA. 2009
  • (en) P. Mistry. Drawing On and Above the surface. In the ACM SIGGRAPH Symposium on Interactive 3D Graphics and Games (i3D2009). Boston, USA. 2009
  • (en) P. Maes, P. Mistry. The Sixth Sense. TED talk in Reframe session.TED 2009. Long Beach, CA, USA 2009 * (en)
  • (en) P. Maes, P. Mistry. Unveiling the "Sixth Sense", game-changing wearable tech. TED 2009. Long Beach, CA, USA 2009
  • (en) P. Mistry, P. Maes. Quickies: Intelligent Sticky Notes. In the Proceedings of 4th International Conference on Intelligent Environments (IE08). Seattle, USA. 2008
  • (en) P. Mistry, K. Sekiya, A. Bradshaw. Inktuitive: An Intuitive Physical Design Workspace. In the Proceedings of 4th International Conference on Intelligent Environments (IE08). Seattle, USA. 2008
  • (en) P. Mistry, T. Kuroki, C. Chang. TaPuMa: Tangible Public Map for Information Acquirement through the Things We Carry. In the Proceedings of the International Conference on Ambient Media and Systems (Amby-sys2008). Quebec City, Canada. 2008.
  • (en) P. Mistry, P. Maes. Intelligent Sticky Notes that can be Searched, Located and can Send Reminders and Messages. In the Proceedings of the ACM International Conference on Intelligent User Interfaces (IUI2008). Canary Islands, Spain. 2008.
  • (en) P. Mistry, N. Nayak. AKSHAR: A mechanism for inputting Indic scripts on digital devices. In the Proceedings of USID2007. Hyderabad, India. 2007.
  • (en) P. Mistry. Invent: Design of a Programming Language for Children. M.Des. Thesis. Industrial Design Center, IIT Bombay. Mumbai, India. 2005.
  • (en) P. Mistry. Ghost in the machine – making creative machines. Special Project. Industrial Design Center, IIT Bombay. Mumbai, India. 2005.
  • (en) P. Mistry. VET: Visual aids to scheduling and decision making for veterinary services. M.Des Project-II Thesis. Industrial Design Center, IIT Bombay. Mumbai, India. 2004.
  • (en) P. Mistry. Ants. Student Poster Animation Competition and Exhibition (SPACE), ACM SIGGRAPH2004. Los Angeles, USA. 2004. (Second prix)

Vidéographie[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. (en) http://www.pranavmistry.com/
  2. (en) Portfolio de Pranav Mistry par lui-même (Version 2005, consultée 2010/02/06)
  3. évocation du travail de P Mistry par la BBC ; SixthSense blurs digital and the real.
  4. ... et sur CNNFarid Zakaria GPS: Innovation Nation
  5. (en) P. Mistry, P. Maes, L. Chang. WUW - Wear Ur World - A Wearable Gestural Interface. In the CHI '09 extended abstracts on Human factors in computing systems. Boston, USA. 2009
  6. Page de présentation personnelle, consultée 2010/02/05
  7. a et b P. Mistry, P. Maes. Intelligent Sticky Notes that can be Searched, Located and can Send Reminders and Messages. Proceedings of the ACM International Conference on Intelligent User Interfaces (IUI2008). Canary Islands, Spain. 2008
  8. Ishii, H. and Ullmer, B., Tangible Bits: Towards Seamless Interfaces between People, Bits and Atoms, in Proceedings of Conference on Human Factors in Computing Systems CHI '97).
  9. (en) Conférence TED où il annonce libérer ses travaux sous licence libre
  10. (en) Fluid interface groupe MIT, à Cambridge
  11. Projet Quickies (P Mistry)
  12. P. Mistry, P. Maes. Quickies: Intelligent Sticky Notes. In the Proceedings of 4th International Conference on Intelligent Environments (IE08). Seattle, USA. 2008 (PDF, 4 pages, en anglais)
  13. Présentation illustrée du Projet Inktuitive
  14. a et b Projet TaPuMa (Consulté 2010/02/05)
  15. "TaPuMa: Tangible Public Map for Information Acquirement through the Things We Carry" ; Pranav Mistry, Tsuyoshi Kuroki, Chaochi Chang ; MIT Media Laboratory., Cambridge
  16. TaPuMa: tangible public map for information acquirement through the things we carry ; Proceedings of the 1st international conference on Ambient media and systems table of contents ; Quebec, Canada ; Article No.: 12 ; 2008 ; ISBN 978-963-9799-16-5 ; Pdf en anglais (459 KB)
  17. Résumé du projet sur le site du groupe Fluid interfaces group (MIT)
  18. (en) P. Mistry. ThirdEye - Multiple viewers can see different things on a single screen. To be appeared in SIGGRAPH Asia 2009, Poster. Yokohama, Japan. 2009
  19. Vidéo de présentant son travail
  20. Page présentant son travail, par lui-même (consultée 2010/02/06)
  21. Vidéo de présentation du Projet Photosynth de Blaise Aguera y Arcas
  22. http://www.ted.com/talks/cameron_sinclair_on_open_source_architecture.html Conférence TED à propos de l'architecture opensource par Cameron Sinclair

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]