Ovido
Idioma
  • Inglês
  • Espanhol
  • Francês
  • Português
  • Alemão
  • Italiano
  • Holandês
  • Sueco
Texto
  • Maiúsculas

Usuário

  • Entrar
  • Criar conta
  • Atualizar para Premium
Ovido
  • Início
  • Entrar
  • Criar conta

BIG DATA

donnees qualitatives

elles decrivent des descriptions qui peuvent etre observee mais ne peuvent etre calculees.

data quantitatives

elles peuvent etre mesure et non simplement observe

data source

web and social
machine

sensing

transaction

iot

les differentes formes de donnees

structure
semi structure

non structure

data store

documet-oriented
column-oriented

graph-based

key value

data staging

cleaning
normalization

transform

data processing

batch
real time

les 5 v

volume
variete

velocite

veracite

valeur

velocity

la rapidite a laquel la data est genere

veracity

exacitude des données

big data vs data

le big data se distingue par sa capacite à traiter des volumes massifs de données variées à grande vitesse.

collectes de donnees

methode utilise pour collecter des data brutes a partir de diverses sources

stockage de data

technique et technologies permettant de stocker des ensembles de donnees massif

visualisation

transformation des data en elements visuel sgnificatifs

tool

Apache (streaming & bach)
Amazon kinesis streaming

IBM Stream Analytics (streaming)

Google Cloud Dataflow ( streming)

nosql

designe uns categorie de BDD concues pour gerer de grande quantite de data dans le contexte du big data. Not Only SQL : Elle vont audela des bases de donnes traditionnelles utilisant SQL.

visualisation des data

power bi
tableau

qlik

excel

Hadoop

hadoop est un framework logiciel open source concu pour le stockage et le traitement de tres grands volumes de data.

Spark

c'est un framework open source de traitement de data à grand echelle, particulirement adapte pour la big data.

outil NoSQL

SQL
OLAP

NoSQL

Graph

Document

Apache Kafka

est decrit comme un cadre permettant de stocker, lire, et analyser les data de streaming, ce qui en fait l'outil le plus adapté au traitement en temps reel parmi les options proposées.

cloud computing d'amazon web service AWS

est un service qui permet d'utiliser des ressources informatiques via internet sans avoir a posederet gerer physiquement ces infrastructure.

Elastic MapReduce (EMR)

Amazon EMR est un service AWS specifiquement concu pour le traitement de grande quantite de data.

big data lifecycle

capture
process

store

analyze

use

source data (big data source)

sensorielle IoT
reseaux sociaux

data transactionnelles

app mobiles

trafic web

structure vs non structure

excel, dtabase vs vide, images, posts reseaux sociaux

database

lakes
warehouse

lake house

cloud

mark

big data collecte

data streaming (real time)
batch processing

collecte de data

la collecte doit etre ethique et respecter les reglementation (ex: rgpd)
la qualite et la fiabilite des data sont essentielles

les methodes de collecte doivent etre adapte aux objectifs d'analyse

le big data implique souvent une collecte continue et en temps reel.

bach processing

traitement par lot

ETL

extraire, transform, telecharger

RGPD (mis en place le 25 mai 2018)

c'est un reglement europeen qui encadre le traitement des data personnelles dans l'UE, renforcant les droits des individus et les obligations des organisahions qui collectent et traite ces data.

reglementation de la collecte des data

Directive Privacy
CCPA

LGPD

PIPEDA

Loi informatique et liberte

Data protection Act 2018

HIPAA

CNIL commission national informatique et liberte

est l'autorite admnistrative independante chargee de veiller a la protection des data personnelles en france.

enjeux et ethique du big data

biais algorithmique et risques de discrimination
surveillance et vie privee

securite des data

qualite et fiabilite des data

securite et confidentialite

Gouvernance

la gouvernance des data dans le contexte du big data est un ensemble de politique, processus et technologiques visant a gerer efficacement de tres grands volumes de data varies et veloces, tout en assurrant la qualite, securite, conformite reglementaire et valeur pour l'entreprise, face aux defis specifique pose par l'echelle et la complexite des data massives.

donne trois exemples de metiers qui utilisent le Big Data

Data analyst
Data scientist

data engineer

donne 4 impacts du big data

emergence de nouveaux metiers
evolution des metiers existants

nouvelles compeyences techniques

competences transverses valorisées

defis du Big Data

complexite de la gestion et de l'analyse des grandes masses de donnees.
l'importances de la formation et du developpement des competences

les defis techniques et organisationnels pour les entreprises

IOT

designe un reseau d'objets physique connectes a l'internet.

data fabric

une data fabric est une architecture de data integre qui unifie, automatise et gere les donnees a travers differents sustemes et environnements.

edge computing

c'est une approche qui consiste a traiter les data au plus pres de leurs sources, plutot que dans des centres de data centralise, afin de reduire la latence, ameliorer les performances et optimiser l'utilisation de bande passante.

informatique quantique

c'est une approche de calcul qui utilise les principes de la mecanique quantique, notamment la superposition et l'intrication des qubits.

l'ia utilise le big data ou l'inverse

l'ia utilise le big data pour s'entrainer et generer des insights plus precis, tandis que le big data beneficie des capacites d'analyse avancees de l'ia pour extraire une valeur significative des data massives.

defis a venir

monopoles des donnees
defis ethique de l'ia avancee et d'utilisation abusive

d'ou viennent les data

systeme de transaction
dossier medicaux

BDD

navigation sur internet

Reseaux sociaux

IOT

Data generer par des machines

application mobile

recherche scientifique

Variete

data structuree
data semi steicture

data non structuee

conception d'une architecture de big data

Adaptation : aux technologies
nouvelles competences

Service de gestion du cloud

machine learning

algorythme d'apprentissage automatique

deep learning

aprentissage profond

Quiz
Diegos Liste
algebra lez. 10
Mission 3 et 4 chapitre 1
Lês jours de la semaine
Francisco
tedesco
Englisch
Vocabulario policial e. inglés
rbot 5
diritto
lac
chimica
Stratégie de com 2
meu
anatomia generale
los 10 filosofos presocraticos
TD3
anatomia oculare e fisiologica
CTM2
K1 Test 1
Darjia 1
Spanish Test 1
muscoli
Darija
robot 3
origine robot 2
Electromag
Studio
Spaanse werkwoorden
Topic 9
Bio chem
math 20 dec exam
Clothes and adjetives
work
Skyddsvakt
Psychology Exam 2
filosofia, logica
Geografia e Historia |Tema 2
HL BIO - gene and division quiz
vocabulario básico
socialpolitik
GAS 3
biologia geral
GAS 2
spanish (type of houses and where you live )
spanish expressions
spanish(general)
spanish (places eg.shops)
spanish (chores)
ENGELS