Mudanças entre as edições de "Grupo de Ciência de Dados"

De Garoa Hacker Clube
Ir para navegação Ir para pesquisar
 
(155 revisões intermediárias por 5 usuários não estão sendo mostradas)
Linha 1: Linha 1:
  +
A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.
== 26 de Julho de 2017 ==
 
  +
  +
Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.
  +
  +
Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.
  +
  +
Participe do nosso grupo do Telegram: https://t.me/DS_Garoa
  +
  +
Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC
  +
=Data Science=
  +
  +
Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹
  +
  +
  +
¹Slveira, Debora Priscila (20 de julho de 2016). [https://www.oficinadanet.com.br/post/16919-o-que-e-data-science O que é Data Science?]. Consultado em 13 de agosto de 2018
  +
=Encontros=
  +
  +
=== 14/novembro/2018 ===
  +
  +
* '''19h30''': Overview à Pandas- Patricia Guisordi
  +
* '''20h30''': Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila
  +
Organizadora: Priscila
  +
Associado responsável: Priscila
  +
  +
== Eventos Passados ==
  +
  +
=== 7/novembro/2018 ===
  +
  +
* '''19h30''': Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (''Luciano Ramalho'')
  +
* '''20h00''': Python em Ciências Sociais (''Guilherme Kenzo'')
  +
* '''20h30''': Intervalo
  +
* '''21h00''': Um modelo de aprendizagem em R (''Yumi Ambriola'')
  +
Organizador/Associado responsável: [[User:LucianoRamalho|Luciano Ramalho]]'''
  +
  +
=== 24/outubro/2018 ===
  +
  +
'''Talk: Programação visual com Orange'''
  +
  +
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
  +
  +
19h30
  +
  +
'''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
  +
=== 17/outubro/2018 ===
  +
  +
'''Talk: Processo de ETL com dados públicos'''
  +
  +
'''Palestrante:''' [https://github.com/edinhodiluviano Edson Bomfim]
  +
'''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 19/setembro/2018 ===
  +
  +
'''Criação de gráficos II'''
  +
  +
Instruções para o pré-estudo em:
  +
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912
  +
  +
'''Atividade organizada por:''' Victor Antoniassi
  +
'''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 12/setembro/2018 ===
  +
  +
'''Criação de gráficos'''
  +
  +
Instruções para o pré-estudo em:
  +
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912
  +
  +
'''Atividade organizada por:''' Victor Antoniassi
  +
'''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 05/setembro/2018 ===
  +
  +
'''Análise Exploratória de Dados IV'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 29/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados III'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 22/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados II'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 15/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados I'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
[http://minerandodados.com.br/index.php/2017/04/27/exploratory-data-analysis-eda/ Tutorial sobre o tema]
  +
  +
Quarta-feira, 15 de agosto, das 19h30 às 22h na [[Sede]] do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 08/agosto/2018 ===
  +
  +
'''Reformulação e planejamento do Grupo de Data Science do Garoa'''
  +
  +
Quarta-feira, 08 de agosto, das 19h30 às 22h45
  +
na [[Sede]] do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' Juca
  +
  +
=== 01/agosto/2018 ===
  +
  +
'''Desafios de Data Science #02.1'''
  +
  +
Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
  +
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]
  +
  +
'''Associado responsável:''' [[User:Juca|Juca]]
  +
  +
=== 25/Julho/2018 ===
  +
  +
'''Desafios de Data Science #02'''
  +
  +
Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
  +
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]?!
  +
  +
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Juca|Juca]]
  +
  +
=== 18/Julho/2018 ===
  +
  +
'''Desafios de Data Science #01'''
  +
Das 19h30 às 22h45 na [[Sede]] do Garoa Hacker Clube
  +
  +
Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?
  +
  +
Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube.
  +
De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation.
  +
Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado
  +
do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science
  +
  +
'''Spoiler''' do segundo desafio: Modelo preditivo!
  +
  +
Conhecimentos recomendados para a atividade:
  +
Alguma familiaridade com programação em geral e Python
  +
Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/
  +
  +
Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Juca|Juca]]
  +
  +
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC
  +
  +
=== 26/Julho/2017 ===
   
 
'''Contingency table, statistics and independence'''
 
'''Contingency table, statistics and independence'''
Linha 14: Linha 194:
 
Flavio
 
Flavio
   
== 19 de Julho de 2017 ==
+
=== 19/Julho/2017 ===
   
 
Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.
 
Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.
Linha 29: Linha 209:
   
   
== 31 de Maio de 2017 ==
+
=== 31/Maio/2017 ===
   
 
Hey guys !
 
Hey guys !
Linha 40: Linha 220:
 
abs
 
abs
 
Tom
 
Tom
  +
  +
[[Categoria:Eventos]]

Edição atual tal como às 11h57min de 10 de novembro de 2018

A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.

Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.

Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.

Participe do nosso grupo do Telegram: https://t.me/DS_Garoa

Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC

Data Science

Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹


¹Slveira, Debora Priscila (20 de julho de 2016). O que é Data Science?. Consultado em 13 de agosto de 2018

Encontros

14/novembro/2018

* 19h30: Overview à Pandas-  Patricia Guisordi
* 20h30: Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila
Organizadora: Priscila
Associado responsável: Priscila

Eventos Passados

7/novembro/2018

* 19h30: Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (Luciano Ramalho)
* 20h00: Python em Ciências Sociais (Guilherme Kenzo)
* 20h30: Intervalo
* 21h00: Um modelo de aprendizagem em R (Yumi Ambriola)
Organizador/Associado responsável: Luciano Ramalho

24/outubro/2018

Talk: Programação visual com Orange
   
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
 
 19h30
 
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes


17/outubro/2018

Talk: Processo de ETL com dados públicos

 Palestrante: Edson Bomfim
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes

19/setembro/2018

Criação de gráficos II
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

12/setembro/2018

Criação de gráficos
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

05/setembro/2018

Análise Exploratória de Dados IV
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

29/agosto/2018

Análise Exploratória de Dados III
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

22/agosto/2018

Análise Exploratória de Dados II
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

15/agosto/2018

Análise Exploratória de Dados I  

 * Visualização de dados em geral;  
 * Estatística descritiva; 
 * Insight sobre os dados;
 
 Tutorial sobre o tema
 
Quarta-feira, 15 de agosto, das 19h30 às 22h na Sede do Garoa Hacker Clube.

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

08/agosto/2018

Reformulação e planejamento do Grupo de Data Science do Garoa

 Quarta-feira, 08 de agosto, das 19h30 às 22h45
 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

01/agosto/2018

Desafios de Data Science #02.1

 Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation

Associado responsável: Juca

25/Julho/2018

Desafios de Data Science #02

 Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation?!
 
 Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

18/Julho/2018

Desafios de Data Science #01
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube

Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?

Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube.
De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation.
Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado
do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science

Spoiler do segundo desafio: Modelo preditivo!

Conhecimentos recomendados para a atividade:
  Alguma familiaridade com programação em geral e Python
  Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/

Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC

26/Julho/2017

Contingency table, statistics and independence

aula de hoje pode ser visualizada ou clonada

https://github.com/flalix/statistics

código em R, pode abrir pdf, html ou pegar os códigos em markdown Rmd. (não esqueçam das imagens).


abr

Flavio

19/Julho/2017

Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.

Meu objetivo é passar a motivação e a base teórica do trabalho original e também que cada um consiga implementar o código na sua linguagem de preferência. Eu vou mostrar o código from scratch em R, ou seja, sem nenhuma biblioteca adicional. Acredito que vai ser bem tranquilo pra todo mundo traduzir para a sua linguagem pois o código só usa loops e operações matriciais.

Não esqueçam de levar os notebooks. =)


Abraços,

Gabriel Perez


31/Maio/2017

Hey guys !

This Wednesday (31/05), it is going to be the fourth Datascience Group meeting! In this session, we plan to apply our skills on a kaggle competition project (https://www.kaggle.com/).

You are very welcome to join, play, share ideas and have fun with us !

abs Tom