Discussion:Big data

Une page de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Autres discussions [liste]
  • Suppression -
  • Neutralité -
  • Droit d'auteur -
  • Article de qualité -
  • Bon article -
  • Lumière sur -
  • À faire -
  • Archives

Startups[modifier le code]

Il faut vite citer d'autres solutions, il y a des dizaines de startup sur le marché, y compris en France; ne mettre qu'une société comme exemple de solutions est injuste; en solutions d'origine américaine on peut citer les sociétés: Cloudera, 10gen, Hadapt, Infochimps, Datastax, Mapr, Pervasive Datarush, Factual, Acunu, Apixio, Citrusleaf, Couchba (source : 01net Big Data la prochaine révolution informatique. Le même article de 01net cite la société française MFG Labs.--Lfone (d) 16 novembre 2011 à 11:20 (CET)

Bonjour et bienvenue sur Wikipédia Sourire,
J'ai surtout retiré la pub pour l'entreprise qui y était présente. Wikipédia étant une encyclopédie et non un annuaire, il ne serait pertinent d'y faire figurer que des entreprises notables vis-à-vis du sujet de l'article (ce qui n'est quasiment jamais le cas de startups).
Amicalement — Arkanosis 16 novembre 2011 à 20:37 (CET)

C'est dommage pour les startups et c'est l'une des limites du principe Wikipedia qui, je le comprends, a besoin de références et de sources; mais, en tant que journaliste ayant interviewé beaucoup de startups, j'y ai trouvé tellement d'idées intéressantes et d'innovations que je me demande comment on pourrait en faire profiter Wikipedia! :)

Demande de suppression du lien vers Hadoop[modifier le code]

Dans la rubrique Voir aussi on note la présence de Hadoop qui est une des technologies proposées pour aborder les problématiques de traitement dans le bigdata (et seulement celles-là). Mais Hadoop n'est pas la seule technologie Big Data ! le danger est de participer à un amalgame Hadoop=Big Data.

Insuffisance en scientifiques spécialisés en Big data[modifier le code]

J'ai modifié un des derniers paragraphes de l'article pour mentionner qu'on aura probablement de plus en plus de difficultés à gérer la data. J'ai ajouté une statistique sur le nombre de scientifiques dont les Etats Unis auront besoin en 2018.

W.G.

Ajout d'une thématique sur la protection des données personnelles face au Big Data[modifier le code]

Le phénomène de Big Data interroge notre système de protection des données personnelles. En France, l'usage de ce type de données est règlementé par la loi Informatique et Libertés qui s'inspire de la directive européenne Protection des données. Comme le Big Data accroit considérablement les possibilité"s de recoupement et donc d'identification d'une personne, l'anonymat semble face aux algorithmes tels que celui de la société américaine Netflix impossible. Notre législation ne semble donc pas adaptée aux enjeux posés par le big data. Est il donc possible de sécuriser les informations personnelles malgré l'usage de Big Data?


Différence avec la business intelligence[modifier le code]

La comparaison avec la BI est très simpliste. Qualifier la BI comme relevant de la statistique descriptive et le Big Data relevant de la statistique inférentielle n'est pas du tout pertinent. L'inférence est tout autant utilisée en BI et ce depuis le début de l'informatique décisionnelle. BI comme Big Data ne sont que des termes, mais dans BI il y a aussi BA : business analytic, la statistique inférentielle et les modèles probabilistes y sont tout autant présent qu'en Big Data. Bref cette section est très importante car BI et BIG Data sont des domaines intriqués, seuls les termes portent à confusion car il ne s'agit ni plus ni moins que d'analyse de données. — Le message qui précède, non signé, a été déposé par l'IP 109.17.78.101 (discuter), le 9 juin 2014. --PAC2 (discuter) 9 juin 2014 à 23:51 (CEST)

ajout de Lablanche & Company[modifier le code]

le compressed sensing est un outil puissant dans l'analyse prédictive. par conséquent j'ajoute une ligne la dessus.— Le message qui précède, non signé, a été déposé par 90.50.191.138 (discuter).

Tout d'abord, merci de passer par la page de discussion, c'est beaucoup mieux. Sur Wikipedia, les décisions sont basées sur le consensus donc c'est important de discuter et de ne pas essayer de passer en force (les passages en force ne réussissent jamais.)
Pour pouvoir ajouter ce passage, il faut montrer que cette compagnie et ce qu'elle fait est notable. Pour cela, il faut trouver des articles de presse, des livres, des reportages,... qui parlent spécifiquement de cette société et en établisse la notoriété. Peux tu fournir ces articles ici pour qu'on puisse juger si elle est assez notable pour justifier l'inclusion.--McSly (discuter) 17 juillet 2014 à 22:35 (CEST)
Par ailleurs nous avons déjà un article sur la technique de l'acquisition comprimée, quelle serait précisément son utilité ici ? JackPotte ($) 17 juillet 2014 à 22:38 (CEST)

oui elle est notable elle a été cité à côté de grands noms comme GE ou Teraview, Bell dans une publication de la NUS national university of singapore une des meilleures universités du monde, classé 22 eme au classement de Shangai voir la partie Client Service de www.lablanche-and-co.com

L'utilité de parler de cette entreprise c'est qu'elle conçoit une application logicielle unique au monde qui est capable de retrouver une zone inconnue (voir page d'acceuil) ce qui va permettre de générer des dizaines voir des centaines de millions de dollards.— Le message qui précède, non signé, a été déposé par 90.50.191.138 (discuter).

Hello, je ne veux pas que tu le prennes mal, mais on n'est pas là pour faire le travail à ta place. Merci donc de fournir ces sources (URL vers chaque article parlant d'elle, citations des passages justifiant la notoriété). Merci aussi de signer tes messages en ajoutant ~~~~ à la fin. --McSly (discuter) 17 juillet 2014 à 22:49 (CEST)

http://www.comp.nus.edu.sg/~rahul/CS6234-14.html

‘Compressed sensing’ on 29-01-2014, presented by Mobashir Mohammad, Aditya Kulkarni, Tobias Bertelsen, Malay Singh, Hirak Sarkar, Nirandika Wanigasekara, Yamilet Serrano Llerena, Parvathy Sudhir

slides of the presentation— Le message qui précède, non signé, a été déposé par 90.50.191.138 (discuter).

C'est tout? rien d'autre? Dans ce cas cette société est sans aucun doute pas notable et il n'y a pas de raison d'inclure le texte.--McSly (discuter) 17 juillet 2014 à 23:12 (CEST)

elle est peut être pas notable mais elle fait des choses qui valent des dizaines de millions et potentiellement elle peut conseiller toutes les grosses boites

Ne pas confondre le préjugé et la réalité technique la réalité technique finit toujours par compenser l'absence de relation ou de moyens Insuffisance en scientifiques spécialisés en Big data: exclusion sociale de sebastien LABLANCHE= sebastien LABLANCHE vend Lablanche & Company 100 millions d'euros c'est aussi ça le génie stratégique— Le message qui précède, non signé, a été déposé par 90.50.191.138 (discuter).

Ok, c'est bon à savoir. En attendant les critères d'admissibilité sur Wikipédia ne sont pas négociables donc dans le futur, si cette compagnie devient notable, on pourra éventuellement l'inclure. D'ici là, il n'y a rien d'autre à ajouter. --McSly (discuter) 18 juillet 2014 à 02:44 (CEST)

Le jour où nous obtiendrons notre contrat avec la défense américaine et le fbi (car nous sommes en contact avec eux, nous exigerons que cela figure sur wilkipedia).— Le message qui précède, non signé, a été déposé par 90.50.191.138 (discuter).

Les critères de notabilité seront appliqués de manière égale pour tout le monde. Il n'y aura pas de parti pris dans un sens n'y dans l'autre. En revanche si tu continues les tentatives de promotions, il t'arrivera la même chose que sur le Wiki anglais, tu seras bloqué ([1]). P.S. Cette contribution n'a fait rire. --McSly (discuter) 18 juillet 2014 à 21:37 (CEST)


oh mais vous savez je n'ai pas besoin de promotion, l'avantage de vivre caché c'est que personne ne risque de me voler mes secrets, et oui.!!! mais par contre le CSS est bien le premier logiciel commercial incluant toutes les applications du compressed sensing et ça c'est vérifiable par conséquent ça doit être maintenu sur la page de l'acquisition comprimé.


Je te conseille de taper sur google 'big data compressed sensing' et tu verras que Lablanche & Company figure parmi les premières réponses (les 2 ou 3 premières pages) sur google.

l'armée peut se servir de ce prototype pour crypter des messages confidentiels. La seule façon d'empêcher ça c'est d'acheter avec l'exclusivité voilà pourquoi les USA font attention surtout que ça va bientôt péter.

Alors vous devez prendre vos responsabilités et travailler en bonne intelligence avec nous et ne pas nous manquer de respect nous ne voulons pas de soucis.

Data lake[modifier le code]

Bonjour à tous, je viens de tomber sur une série d'article sur le "data lake" (lac de données), concept émergent et relatif au big data qui permet de fournir un stockage global des informations présentes dans une entreprise. Je pense qu'il pourrait être intéressant de l'intégrer à la page Big data, qu'en pensez-vous ?

Quelques sources :

Bonne après midi, Bo'RaiCho (discuter) 30 octobre 2015 à 16:38 (CEST)

Fondamentalement[modifier le code]

Je pense que l'article tourne un peu autour du pot à l'image du milieu informatico-économique qui aime faire passer n'importe quelle réalité triviale pour quelque chose d'hyper complexe et fantasmagorique sans dévoiler clairement les choses. Ne pas oublier que les acteurs de ce milieu ne sont pas des sources d'autorité, ce sont des discours passionnés et commerciaux.

Le "big data" est une politique de recherche scientifique qui place la récolte massive de données en priorité, la capacité d'analyse étant évaluée après coup. Sans certitude sur la capacité d'analyse, le "big data" promeut l'analyse probabiliste qui donne des indices sur l'information contenue dans la donnée, mais sans aller jusqu'au bout de l'identification. Economiquement, cela a évolué en un mode d'offre : la donnée et sa représentation graphique se vend, sans besoin de l'analyser entièrement. Ces acteurs économiques sont avant tout des gestionnaires de traitement informatique qui cherchent à transformer les données à la vitesse du flux de disponibilité. Ce mode de travail est actuellement très rentable, compte-tenu de l'organisation des rémunérations et d'un marché du travail adapté, ce qui en fait sa grande popularité.

Mégadonnées[modifier le code]

Bonjour, Pourquoi ne pas mettre l'article sous l'entrée "Mégadonnées" et rediriger "Big Data" vers celle-ci, plutôt que l'inverse? C'est ce qu'on ferait si on voulait renforcer l'usage du terme recommandé... --HeisenbergO2 (discuter) 22 décembre 2016 à 15:28 (CET)

WP prends en compte les usages et les reflète, mais ne les anticipe pas, ni ne promeut un terme plutôt qu'un autre. Principe de moindre surprise, neutralité etc.. --Jean-Christophe BENOIST (discuter) 22 décembre 2016 à 19:55 (CET)