Pattern Discovery 3



Comment

이번 시간에 배울 주제는 Sequential Pattern Mining 입니다. GSP (Generalized Sequential Patterns) Vertical Format-Based Mining: SPADE Pattern-Growth Methods: PrefixSpan Mining Closed Sequential Patterns: CloSpan Constrain-Based Sequential Pattern Mining sequential pattern mining 은 다양한 곳에 사용됩니다. customer shopping sequences medial treatments web click streams, calling patterns program execution sequences (software engineering)…

Read this article

Cloud Computing, P2P Systems



Comment

P2P 시스템의 기술들은 cloud computing 의 많은 분야에서 활용됩니다. 뒤에서 배울 Chord P2P hashing 같은 경우는 Cassandra, Voldmort 등의 key-value store 에서 쓰이고 있습니다. Napster 최초에 peer 는 서버에게 메세지를 보내 P2P 시스템에 가입했다는 사실을 알립니다. Napster 에서는 중앙에 서버를 두어, 파일이 저장된 peer 를 기록합니다. 각 peer 는 파일이…

Read this article

Cloud Computing, Membership Protocol



Comment

왜 membership 이란 개념이 클라우드 컴퓨팅에 필요할까요? 한 노드가 OS, Disk, Network 등 때문에 10년 (120개월) 마다 한 번씩 고장난다고 합시다. 그러면 120개의 노드를 가지고 있다면 1개월마다 한 번씩입니다. 이정도는 참을만하죠? 그런데, 12,000 개의 서버를 가지고 있다면 MTTF (mean time to failure) 는 7.2 시간마다 한번씩입니다. 이건 큰…

Read this article

Cloud Computing, Gossip Protocol



Comment

Multicast 이번시간에 배울 내용은 Gossip Protocol (혹은 Epidemic Protocol) 입니다. 기존에는 특정 그룹에게 메세지를 보내기 위해 multicast 를 이용했지만, 클라우드 컴퓨티 환경에서는 프로세스가 죽어 노드가 크래쉬를 일으킬수도 네트워크 문제때문에 패킷이 딜레이되거나, 드랍될 수 있고 노드가 빠르게 증가합니다. 그러나 멀티캐스트는 fault-tolerance 와 scalability 측면에서 부족한 부분이 많았습니다. 이런 문제를 해결하기 위해…

Read this article

Pattern Discovery 2



Comment

패턴 마이닝을 통해 만들어지는 수많은 pattern, rule 이 모두 유용한 것은 아닙니다. 따라서 interestingness measure 을 위해 객관적이거나, 주관적인 평가방법을 이용할 수 있습니다. (1) Objective interestingness measures support, confidence, correlation (2) Subjective interestingness measures Query-based: relevant to a user's particular request Against one's knowledge-base: unexpected, freshness, timeliness Visualization tools: Multi-dimensional,…

Read this article