Python

06.19 시험보고 선생님이 대충 말해준 부분

우롱차 2020. 8. 29. 15:00
728x90

빅데이터 수집 ( 웹 크롤링) 웹 스크래핑 or 웹 크롤링 // 엄연히 따지면 구분해서 써야햄

우리가 하고있는게 웹스크래핑이랑 비슷함.

돌아다니면서 자동화된 봇이 뭔갈 긁어대는게 웹 크롤러라고하고

웹스크래핑은 특정한곳에서 긁어오는건 스크래핑했다. 라고 한다.


NOSQL와 RDB 같이 상생해서 씀

서로 상호보완하는거

서로의 장단점을 업그레이드가 된거 아님!! 그냥

 

MongoDB <- NOSQL의 기반

  • NOSQL / Not Only SQL or NO SQL!  => 명칭이 조금 다양해 not only sql이라고 대부분 받아들임

    1. Key-value (Redis)

    2. Column Oriented (Cassandra)

    3. Document (MongoDB)

      • 총 세개

      • mongodb는 도큐먼트 방식

      • 실질적으로 NOSQL을 쓸려면 RDB배우면 쉬운데

      • RDB가 아닌 그 외의 방식을 NOSQL이라고 한다.

  • RDB 관계형 베이스 <-SQL이라는걸 배워야함 스트럭쳐 쿼리드 랭귀지 (구조질의어)

    • member 테이블 이있는데 나한테 줄수있겠니? 하고 물어봐야함.구조화된 질의를 보내면 그거에맞게 관계형 데이터베이스가 나한테 데이터를 준다.

    • 구조화된, 정형화된 일정한 문법에 맞게 보내야함. SQL

    • 관계형 : 테이블구조

    • Document=doc

id

name

phonenum

 

 

 

 

 

 

    • SELECT : 정보를 나한테 줘

    • id도있고 이름도있고 저나버노

    • 필요한거만 적으면돼 SELECT id, phone FROM member;  : 구조화된 질의 멤버테이블에서 id와 폰의 정보만 셀렉해서 보여주라고 하는거구나

    • 대문자는 SQL 문법임.  ↑ 이게 SQL

    • SELECT id, phone FROM member;

    • INSERT

    • UPDATE

    • DELETE   등등


mongodb는 도큐먼트 방식

도큐먼트는 그냥 명함하나를 셀하나에 통으로 넣는거임.우리가 몽고디비에 넣은거는 관계형 데이터베이스랑 똑같이 넣은거

단지 표현하는건 저렇게 된거지만

명함 : [daddsfsfs],

  [sdgfdgdf],

이런식으로 넣는건데 /

우리가 몽고디비에다가 넣은거는관계형 데이터베이스처럼 넣은거고

도큐먼트 방식이라고 무조건 도큐먼트 방식으로 넣을 필요는 없는거지


우리가 짜고있는건 파이썬 프로그래밍

파이몽고라는애가

파이썬이 몽고디비랑 대화할수있게 해줌

사람(파이썬)이 은행원ㅇ

 

몽고디비니느 data를 CRUD 할때 제이쑨이라는애를 해야하는데

몽고디비는 딕트타입방식으로만 데이터를 넣고 빼고 수정 삭제를 할 수 있음

이타입이 아니면 넣을 수가 없음.

728x90