Initiation à l informatique

Initiation à l informatique Acquisition et traitement de données David Gall laboratoire de Neurophysiologie dgall@ulb.ac.be

Initiation à l informatique cours V : acquisition et traitement de données Dans une démarche de recherche l informatique intervient dès le début, au niveau de : acquisition des données analyse des données publication des données

Informatique scientifique Acquisition de données L informatique intervient à tous les niveaux de la démarche scientifique et notamment au niveau de la mesure du signal: signal temporel: potentiel d action neuronal signal spatial: imagerie confocale signal spatio-temporel: imagerie calcium

Informatique scientifique Analyse de données données brutes données analysées statistiques extraction de paramètres

Acquisition du signal conversion analogue/digitale signal analogique signal numérique 010010101010010 Problème : on mesure une grandeur physique continue avec un système informatisé le signal mesuré doit être discretisé pour être représente de manière digitale (l amplitude et le temps sont représentés par des nombres binaires) perte d information comment s assurer que la grandeur digitale mesurée représente fidèlement la grandeur physique au cours du temps?

Conversion analogue/digitale chaîne d acquisition numérique grandeur physique capteur amplificateur délivre un signal électrique (V) image du phénomène physique mesuré adapter le niveau du signal issu du capteur à la chaîne globale d acquisition. filtre limite le contenu spectral du signal aux fréquences qui nous intéressent (v. + loin) échantillonneur bloqueur prélève à chaque période d échantillonnage la valeur du signal et la fige le temps nécessaire à la conversion analogue/digitale convertisseur AD transforme la tension de l échantillon (analogique) en un code binaire (numérique). 010010101010010 mesure numérique

Chaîne d acquisition numérique capteurs Le capteur délivre un signal électrique (V) image du phénomène physique mesuré. Ses caractéristiques (sensibilité, vitesse de réponse,...) doivent être choisies pour permettre la mesure du phénomène à étudier. exemple de capteur: microphone autres exemples : caméra CCD (mesure de fluorescence), électrode Ag/AgCl (électrophysiologie), thermocouple (mesure de température),...

Chaîne d acquisition numérique amplificateur Les signaux produits par le capteur sont souvent trop faible par rapport à la plage d entrée du convertisseur AD (typiquement 0-5V). Il faut donc adapter le niveau du signal issu du capteur à la chaîne globale d acquisition. Une étape d amplification est nécessaire. Le facteur d amplification est appelé gain et est lié rapport entre la tension de sortie et la tension en entrée: G = Vout/Vin exemple d amplificateur: électrophysiologie (patch-clamp) rmq : il est crucial que l étape d amplification n introduise pas de distorsion du signal. Il faut donc aussi bien choisir les caractéristiques de l amplificateur (linéarité de la réponse, stabilité du gain en fréquence,...) en fonction du phénomène à étudier.

Chaîne d acquisition numérique filtre Il s agit toujours d un filtre passe-bas (qui coupe les hautes fréquences) pour limiter le contenu spectral du signal aux fréquences qui nous intéressent (v. + loin). Un filtre passe-bas est caractérisé par sa fréquence de coupure : exemple de filtre : électrophysiologie (patch-clamp)

Chaîne d acquisition numérique échantillonneur/bloqueur et convertisseur AD C est à ce niveau que le signal analogique amplifié et filtré va être converti en un signal numérique. Les caractéristiques importantes pour le choix d un convertisseur AD sont: la plage d entrée (0-5V en général) la vitesse d échantillonnage maximale la résolution (8 bits, 16 bits) exemple de convertisseur AD: ITC 16, électrophysiologie (patch-clamp)

Convertisseur analogue/digital fréquence d échantillonnage et résolution Le choix de la fréquence d échantillonnage et de la résolution du convertisseur sont capital pour pouvoir acquérir un signal numérique représentant correctement le signal analogique original. 44 khz 16 bits Mono (3.5 Mb) 44 khz 8 bits Mono (740 kb) 22 khz 8 bits Mono (424 kb) 11 khz 8 bits Mono (120 kb)

Théorie de l information théorème de Nyquist-Shannon Le théorème de Nyquist-Shannon : la fréquence d'échantillonnage d'un signal doit être égale ou supérieure à 2 fois la fréquence maximale contenue dans ce signal, afin de convertir ce signal d'une forme analogique à une forme numérique. Ce théorème est à la base de la conversion numérique des signaux. pour des fréquences d échantillonnage inférieure à deux fois la fréquence maximale contenue dans le signal, le signal numérique ne représente plus fidèlement le signal analogique d origine.

Thèorème de Nyquist-Shannon échantillonnage d un signal analogique sinusoidal Considérons le cas où l on désire réaliser une acquisition numérique fidèle d un signal analogique sinusoidal de 10 Hz.

Thèorème de Nyquist-Shannon échantillonnage d un signal analogique sinusoidal un échantillonnage à 5 Hz induit : erreur sur l amplitude erreur sur la fréquence (le signal acquisi est constant!)

Thèorème de Nyquist-Shannon échantillonnage d un signal analogique sinusoidal un échantillonnage à 11 Hz induit : amplitude correcte erreur sur la fréquence (le signal acquis à une fréquence de 1 Hz)

Thèorème de Nyquist-Shannon échantillonnage d un signal analogique sinusoidal un échantillonnage à 11 Hz induit : amplitude variable erreur sur la fréquence

Thèorème de Nyquist-Shannon échantillonnage d un signal analogique sinusoidal un échantillonnage à 20,1 Hz induit : amplitude variable fréquence correcte

Thèorème de Nyquist-Shannon échantillonnage d un signal analogique sinusoidal un échantillonnage à des fréquences supérieures à 20 Hz permet une reconstruction fidèle du signal et minimise l erreur sur l amplitude.

Thèorème de Nyquist-Shannon en pratique Pour pouvoir choisir la fréquence de coupure du filtre, ffiltre, et la fréquence d échantillonnage, fechant, il faut décider quelle est la fréquence maximale, fmax, que l on désire mesurer en fonction du phénomène que l on désire observer. fmax déterminé, on fixe ffiltre fmax on échantillonne au moins à fechant > 2 * ffiltre rmq : un potential d action neuronal dure environ 1 ms (fmax = 1 khz). Donc une fréquence de coupure du filtre passe-bas de ffiltre = 1 khz et une fréquence d échantillonnage fechant = 4 khz permettra de détecter les potentiels d action.

Thèorème de Nyquist-Shannon exemple : enregistrement audio digital La meilleure illustration de l'application de ce théorème est la détermination de la fréquence d'échantillonnage d'un CD audio, qui est de 44,1kHz. En effet, l'oreille humaine peut capter les sons jusqu'à 16kHz, quelques fois jusqu'à 20kHz (filtre passe-bas). Il convient donc, lors de la conversion, d'échantillonner le signal audio à au moins 40kHz. 44,1kHz est la valeur normalisée par l'industrie. Le son est codé sur 16 bits en stéréo. On a donc : 44100 x 16 x 2 = 1411200 bits/s = 1411 kbps (bitrate) pour coder le son sur un CD audio.

Thèorème de Nyquist-Shannon exemple : photo numérique Une autre illustration de l'application de ce théorème concerne la résolution spatiale des appareils photos numériques. Si l objet à photographier contient une structure périodique dont la longueur caractéristique apparente est trop faible par rapport à la taille des pixels, on obtient un effet de moiré qui n existe pas en réalité.

Chaîne d acquisition numérique exemple : poste d électrophysiologie échantillonneur bloqueur convertisseur AD filtre passe-bas amplificateur capteur (différence de potentiel transmembranaire)

Analyse de données but Une fois les données acquises, il faut encore les exploiter c-à-d : en extraire les données pertinentes du point de vue biologique visualiser ces données extraire les valeurs des paramètres d intérêt effectuer un test statistique Nous allons l illustrer dans un exemple : mesure de la concentration en calcium cytosolique au niveau synaptique

Imagerie calcium principe de base La technique repose sur l existence d indicateur fluorescent dont les caractéristiques spectrales varient en fonction de la concentration en calcium libre en solution (exemple: Oregon Green 488 BAPTA-1, OG1) OG1 + Ca OG1-Ca On peut montrer que la grandeur suivante varie proportionnellement à la concentration en calcium libre : [Ca2+]i F/F0 =(Ft-F0)/F0 où Ft est l intensité de fluorescence au temps t et F0 l intensité de fluorescence initiale, de la zone considérée. (Helmchen et al., Biophys. J. 72: 1458-1472)

Imagerie calcium acquisition des données injection de l indicateur fluorescent (patch-clamp) acquisition d image image 8 bits

Analyse de données imagerie calcium Données brutes : images 320 x 240 pixels, 8 bits (256 niveaux), toutes les 50 ms fluorescence intensity mossy fiber stimulation basal 56 ms 1465 ms 2482 ms 4738 ms Analyse des données : calculer F/F0 au cours du temps au niveau synaptique ROI mf stimulation 0.2 1 s

Imagerie calcium analyse de données : calcul de F/F0 Le logiciel d acquisition de données permet de sélectionner des zones d intérêt où il évalue l intensité de fluorescence au cours du temps. Il permet d enregistrer ces valeurs en format ascii (*.txt), ce qui permet de les récupérer dans un tableur. zone 2 (background) zone 1 (synapse)

Analyse de données tableur Un tableur (typiquement Microsoft Excel) est une application qui permet d enregistrer, d analyser les données. Il permet d automatiser les calculs répétitifs Les tableurs courants sont des outils génériques mais ne permettent pas de manipuler de grandes q u a n t i t é s d e données, ni de p r o d u i r e d e s graphiques de bonne qualité.

Imagerie calcium analyse de données : calcul de F/F0 A l aide du tableur, on calcule la fluorescence corrigée en soustrayant la valeur background à celle mesurée à la synapse pour chaque temps.

Imagerie calcium analyse de données : calcul de F/F0 A l aide du tableur, on calcule la fluorescence initiale (F0) en calculant la moyenne sur les trois premières images (avant stimulation).

Imagerie calcium analyse de données : calcul de F/F0 A l aide du tableur, on calcule le pseudo-ratio F/F0 =(Ft-F0)/F0 à chaque temps

Imagerie calcium analyse de données : étape 5 A l aide d un logiciel d analyse de données, on représente graphiquement l évolution de F/F0 au cours du temps.

Analyse de données représentation des données Il existe des applications spécialisées pour la représentation et l analyse des données scientifiques qui permettent: la manipulation de grandes quantité de données sous forme de vecteurs la visualisation ces données sous forme graphique (série temporelle, histogramme,...) l extraction de valeurs de paramètres d intérêt par ajustement de courbe analyse statistique exemple : Matlab, Maxima, Igor Pro, Sigma Plot, SPSS, Prism...

Imagerie calcium analyse de données : mesure de la constante de temps A l aide d un logiciel d analyse de données, on évalue la constante de temps de retour au niveau basal de F/F0 en effectuant un ajustement de courbe non linéaire (exponentielle simple)

Imagerie calcium analyse de données : test statistique Deux séries d expériences ont été réalisées : une série contrôle et une série en présence de 500 nm de thapsigargin. On veut tester si la présence de la thapsigargin modifie la constante de temps de retour au niveau basal de F/F0. A l aide du tableur, on effectue le test statistique. A l aide d un logiciel d analyse de données, on représente le résultat.