Bienvenue au premier colloque du centre de recherche en données massives François Laviolette, Directeur du centre Courriel: Francois.Laviolette@ift.ulaval.ca 1
Aujourd hui 29 octobre, c est la journée de l internet!! 2
Qu est-ce que le Big Data D abord, quel est le bon terme Français? Les Français parlent de mégadonnées Nous avons choisi l expression données massives
Les 4 V du Big Data Volume Vélocité Variété Véracité Lorsque nous sommes en présence d un ou plusieurs de ces V, Nous faisons face à un problème de Big Data http://saisa.eu/blogs/guidance/wp-content/uploads/2013/08/big-data-infographic.png
Autre visualisation du Big Data Le diagramme de Venn de Drew Conway sur le big data
Ce qu est le Big Data Nous proposons une définition la plus inclusive possible: «la problématique des données massives conduit généralement à un besoin de développer de nouvelles méthodes d analyse de l information, dans le but de traiter un plus grand nombre de données, de provenances de plus en plus disparates et sous une forme de moins en moins structurée.»
Que faire avec les données? 7
En Big Data, 2 catégories de problèmes Ø Possibles Le problème est bien défini (on sait ce qu on cherche) o L exemple de Netflix o L exemple de Geovoxel Ø Difficiles Il y a de l information dans nos données, on veut aller la chercher o Quelle information au juste? o Toute l information!!!! 8
Ce qu est le Big Data Nous proposons une définition qui soit la plus inclusive possible: En gros, «la problématique des données massives conduit généralement à un besoin de développer de nouvelles méthodes d analyse de l information, dans le but de traiter un plus grand nombre de données, de provenances de plus en plus disparates et sous une forme de moins en moins structurée.» «la recherche en ce sens doit d être multi-disciplinaire, comportant d une part, des chercheurs connaissant leur domaine et qui sont aux prises avec un problème d avalanche de données, et d autre part des chercheurs pouvant développer de nouvelles méthodes de traitement et d analyse de ces données.»
Les membres du Centre 36 chercheurs 5 facultés (Sciences et Génie, Médecine, Foresterie, Sciences de l Administration, sciences de l agriculture et de l alimentation) 11 départements (Informatique, Mathématique, Génie informatique, Biochimie, Biologie, Médecine, Médecine sociale et préventive, Génie industriel, Sciences géomatiques, Opération et systèmes de décision) une coordonnatrice scientifique, Mme Lynda Robitaille Courriel: Lynda.Robitaille@ift.ulaval.ca
Programme de recherche Le centre sera un développeur de méthodes et processus liés aux données massives 3 thèmes Bio-informatique Traitement de données non ou partiellement structurées et représentation des connaissances Sécurité et confidentiallité des données Ces 3 thèmes ont été choisis parce que: ils sont pertinents dans un contexte de données massives; ils répondent à un besoin pour les chercheurs et pour l industrie; nos membres ont l expertise nécessaire; nous sommes complémentaires et non en compétition avec les autres centres de recherche et institut de l Université Laval.
Notre colloque de lancement: le 29 octobre 12
Organisation et fonctionnement
Pertinence du centre Répond à un besoin tant au niveau des chercheurs qui sont aux prises avec des avalanches de données de moins en moins structurées qu au niveau de l industrie qui réalise qu il est important de savoir traiter et analyser ces données. À titre d exemples: En génomique, on utilise encore uniquement les snip (Single Nucleotide Polymorphism) au lieu de considérer le génome au complet. Ajusto des assurances Desjardins ne garde qu une faible partie de l information que ces senseurs collectent. En foresterie, les abatteuses émondeuses prennent un scan 3D de chaque tronc d arbre abattu. Tous ces scans sont effacés à la fin de la journée
Calcul Québec et le centre Les synergies anticipées entre le Centre et Calcul Québec sont multiples. Tout d abord, la création du Centre permettra une meilleure coordination des demandes d allocation, afin que les chercheurs du Centre puissent globalement bénéficier d un meilleur accès aux ressources de Calcul informatique de pointe Le directeur actuel de Calcul Québec, Prof. Marc Parizeau est membre du centre et même membre du comité de concertation
Positionnement du centre aucun autre centre de recherche sur les données massives au Québec (ou au Canada) Deux viennent de voir le jour à Paris Il y en a aux Etats-Unis À l École Polytechnique de Montréal, il y a un projet de chaire d excellence du Canada sur le Big Data et un projet APOGÉ projeté sur le même sujet.
Les besoins de formation en «data science» Conjointement avec le département d informatique, nous sommes à élaborer: - une nouvelle concentration 1 er cycle en données massives; - Un microprogramme de 2 e cycle. Initiative semblable avec le département de statistique Idem avec la Faculté des Sciences de l Administration De plus, un nouveau professeur sera embauché en informatique afin de renforcer la filière donnée massive.
Le centre favorisera La collaboration entre les chercheurs Le démarchage menant à de nouvelles subventions et autres activités. Ce sera une des tâches de Mme Lynda Robitaille, notre coordonnatrice scientifique Dans un premier temps, le centre visera : Stages Mitacs, bourses BMP, Engage etc Organiser un colloque à l automne (aujourd hui) et une école d été en 2016 À plus long terme Grosses subventions comme RDC, FRQNT-stratégique (ou l équivalent) Association à divers grand projets Projets Apogée, génome Canada, VCO, Alliance Santé Québec, OVH, Desjardins, 18
Liste des rencontres (développement privé et autre) Jean-Michel Garro de chez Québec International André Houle et Yves Matte de chez SOVAR Jean-Pierre Després et de Luc Ricard à l IUCPQ (Alliance santé Québec) Hacking Health via Québec International Le Consortium Aliments santé via Québec International OVH (Frank Hausselman) Thalès 04h11 (Eliot Jacquin et Frédéric Camara) Centres de recherche et Institut: CIRRIS, CRG, CIRRELT, ITIS Le projet Sentinel North 19
Programmes de subvention Mise en contexte Pour une entreprise en TI, il est essentiel d innover! L innovation repose sur une main-d œuvre hautement qualifiée À titre d indication, l Association de la recherche industrielle du Québec recommande : «Encourager la participation des étudiants de 2 e et 3 e cycles dans le processus d innovation des entreprises en identifiant les zones critiques appropriées d intervention où ils feront la différence.» 20
Programmes de subvention Programme MITACS Accélération Financement de stages de 4 à 6 mois en industrie (restrictions pour hôpitaux, gouvernement et OBNL) Le stage doit être «en lien» avec le programme d études (pas d obligation d être contributoire) 7500 $ (entreprise) + 7500 $ (MITACS) donne 10k $ à l étudiant et 5k $ au professeur (pour encadrement) Admissible au crédit d impôt Maîtrise : maximum de 2 stages Doctorat : maximum de 4 stages 21
Programmes de subvention Programme MITACS Accélération Grappes de stages! Pour 6 stages (3 étudiants minimum): Entreprise: 36k $ MITACS-FQRNT: 44k $ Incrémentation : pour chaque tranche de 18k $ provenant de l entreprise, MITACS fournit 22k $ Pas de concours : la demande peut être déposée en tout temps! (taux acceptation > 90%) Contacts: www.mitacsacceleration.com Anick Brosseau: abrosseau@mitacs.ca 22
Programmes de subvention Subvention d engagement partenarial (CRSNG) Pour initier un partenariat entre un chercheur et une entreprise n ayant jamais collaboré Pour appuyer de courts projets R&D Doit viser des objectifs à court terme (6 mois) Doit viser à résoudre un problème propre à l entreprise Donne jusqu à 25k $ au chercheur L entreprise doit contribuer en nature au projet Contribution en espèce non requise de l entreprise La demande peut être déposée en tout temps! Voir www.nserc-crsng.gc.ca 23
Programmes de subvention Subventions de projets stratégiques (CRSNG) Concours : demandes déposées le 15 avril Traitement : environ 6 mois Taux de succès : environ 28% Jusqu à 200k $ par année (max. 3 années) Contribution en espèce non requise Contribution en nature requise : participation active de l entreprise; elle doit être en mesure d exploiter les résultats du projet de recherche Voir www.nserc-crsng.gc.ca 24
Programmes de subvention Subventions R&D coopératives (CRSNG) Projets de 1 à 5 ans De 10k $ à 500k $ par année L entreprise doit contribuer d une valeur égale au montant demandé au CRSNG La contribution en nature peut aller jusqu à 50% de la contribution du CRSNG Ex.: 50k $ en espèce + 50k $ en nature + 100k $ du CRSNG Contributions admissibles aux crédits d impôt Le projet peut se situer à n importe quel point de la gamme des activités R&D, pourvu qu il respecte le mandat de recherche + formation + transfert de technologie de l université. Voir www.nserc-crsng.gc.ca 25
Programmes de subvention Subventions R&D coopératives (CRSNG) Projets de 1 à 5 ans De 10k $ à 500k $ par année Demandes déposées en tout temps Traitement : environ 4 mois Taux de succès : environ 85% Voir www.nserc-crsng.gc.ca 26
Échanges 27