Pattern Discovery 3


이번 시간에 배울 주제는 Sequential Pattern Mining 입니다. GSP (Generalized Sequential Patterns) Vertical Format-Based Mining: SPADE Pattern-Growth Methods: PrefixSpan Mining Closed Sequential Patterns: CloSpan Constrain-Based Sequential Pattern Mining sequential pattern mining 은 다양한 곳에 사용됩니다. customer shopping sequences medial treatments web click streams, calling patterns program execution sequences (software engineering)…

Read this article

Cloud Computing, P2P Systems


P2P 시스템의 기술들은 cloud computing 의 많은 분야에서 활용됩니다. 뒤에서 배울 Chord P2P hashing 같은 경우는 Cassandra, Voldmort 등의 key-value store 에서 쓰이고 있습니다. Napster 최초에 peer 는 서버에게 메세지를 보내 P2P 시스템에 가입했다는 사실을 알립니다. Napster 에서는 중앙에 서버를 두어, 파일이 저장된 peer 를 기록합니다. 각 peer 는 파일이…

Read this article

Cloud Computing, Membership Protocol


왜 membership 이란 개념이 클라우드 컴퓨팅에 필요할까요? 한 노드가 OS, Disk, Network 등 때문에 10년 (120개월) 마다 한 번씩 고장난다고 합시다. 그러면 120개의 노드를 가지고 있다면 1개월마다 한 번씩입니다. 이정도는 참을만하죠? 그런데, 12,000 개의 서버를 가지고 있다면 MTTF (mean time to failure) 는 7.2 시간마다 한번씩입니다. 이건 큰…

Read this article

Cloud Computing, Gossip Protocol


Multicast 이번시간에 배울 내용은 Gossip Protocol (혹은 Epidemic Protocol) 입니다. 기존에는 특정 그룹에게 메세지를 보내기 위해 multicast 를 이용했지만, 클라우드 컴퓨티 환경에서는 프로세스가 죽어 노드가 크래쉬를 일으킬수도 네트워크 문제때문에 패킷이 딜레이되거나, 드랍될 수 있고 노드가 빠르게 증가합니다. 그러나 멀티캐스트는 fault-tolerance 와 scalability 측면에서 부족한 부분이 많았습니다. 이런 문제를 해결하기 위해…

Read this article

Pattern Discovery 2


패턴 마이닝을 통해 만들어지는 수많은 pattern, rule 이 모두 유용한 것은 아닙니다. 따라서 interestingness measure 을 위해 객관적이거나, 주관적인 평가방법을 이용할 수 있습니다. (1) Objective interestingness measures support, confidence, correlation (2) Subjective interestingness measures Query-based: relevant to a user's particular request Against one's knowledge-base: unexpected, freshness, timeliness Visualization tools: Multi-dimensional,…

Read this article