'검색이야기'에 해당되는 글 89건
- 2009/05/12 Build your own Search Engine and Search Service in one hour. (11)
- 2009/04/23 야후 홈페이지의 뉴스메뉴는 "뉴스홈"일까 "주요뉴스"일까? (2)
- 2009/04/16 성장하는 야후 블로그검색 (6)
- 2009/04/14 멋진 네이버 트렌드 연감 (2)
- 2009/04/14 피할 수 없는 새로운 기회 : 클라우드
2009/05/12 02:28
Build your own Search Engine and Search Service in one hour.
2009/05/12 02:28 in 검색이야기

/**
휴. 뭘하나 만들어 내는것은 이제 벅찬일인듯 합니다.
머리도 안돌고, 코딩은 더욱 어눌하고.
주위에서 도움을 받고 많은 라이브러리를 가져다 썼음에도 불구하고 어려운건 어렵군요.
**/
몇가지 구상을 하고 필요한 플래폼을 준비중에 있습니다.
이제 그 첫번째로 Search Engine Plaform을 조심스레 선보입니다.
일반개발자들에게 검색엔진을 도입하거나 접목하는 일은 그리 쉬운일은 아닙니다.
database를 많이 다루던 사람들에게도 항상 불만인것이 그놈의 Like 검색입니다.
게다가 키워드에 대한 랭킹이 들어가면 손을 들수 밖에 없습니다.
또한 소규모나 대규모의 기업에게 있어서 검색엔진의 도입은 상당한 비용과 많은 튜닝작업으로 많은 투자가 일어나게 됩니다.
최근에 아마존의 simpleDB나 구글의 AppEngine의 등장은 상당히 고무적인것이긴 하나 그것들은 spread sheet류의 작은 String 데이터만을 다루기 때문에 fulltext 검색기능을 제공하지는 않는듯 합니다.
이러한 부분에 도움이 되고자 Search Engine Platform을 준비했습니다.
사실 아직 플랫폼이라 명명하기에는 부족한면이 많이 있지만 그래도 플래폼이 되고 싶어 계속 발전할 것입니다.
모든 데이터를 담고 싶어서 "대지의 여신"이라는 GAIA(가이아)로 명명하였습니다.(가칭)
GAIA 서비스는 클라우드컴퓨팅과 클라우드스토리지기반으로 돌아가므로 클라우드 데이터서비스가 가질수 있는 장점을 대부분 담으려고 합니다.
이제 막 테스트를 해야 하는 상황이므로 클로우즈베타로 5-6월정도 운영해볼까 합니다.
그 와중에 많은 문제점과 개선점이 생기겠지요.
검색플래폼을 개선해 나가는 동안 두번째와 세번째 플래폼도 하나씩 선보일 예정입니다.
검색플래폼은 말 그대로 "검색"에 중점을 두었기 때문에 다른 기능상의 장점들은 덜 부각시키려 합니다.
그 기능상의 장점들은 다른 플래폼에서 부각되어 알려질겁니다.
GAIA 검색플래폼은 기본적인 테스트와 관리를 위한 "웹 브라우저"를 통한 접근과 개발자가 직접 데이터를 입출력하고 검색기능을 구현할 수 있는 "OPEN API"를 통한 접근으로 이루어져 있습니다.
OpenApi를 통해서는 여러가지 검색튜닝을 시도해 볼수 있습니다.
클로우즈베타 기간에는 브라우저로는 누구나 테스트해볼수 있으나
OPEN API는 승인된 개발자에게만 접근이 허용됩니다.
그래서 클로우즈베타를 위한 개발자와 관련자들의 신청을 받습니다.
신청은 가입을 하시고 이 블로그에 덧글을 달거나 drgru@hotmail.com으로 메일주시면 됩니다.
위 이메일 주소로 msn 접속도 가능합니다.
신청양식은 그냥 자유롭게 해주시면 됩니다.(누구고, 어느정도의 데이터를 어떻게 해보고 싶은 정도... 그렇지만 그냥 단순한 테스트는 허용되지 않습니다. 목적이 있는 테스트의 경우에만 open api 접근이 허용됩니다.)
그루터는 당분간 일반인 대상 서비스를 만들기보단 그러한 서비스를 만드는데 지원할수 있는 시스템에 주력할 생각입니다.
그래서
다음과 같은 분들이 함께 해봤으면 좋겠습니다.
- 검색 서비스 개발자
- 데이터 관련 개발자
- 쇼핑검색 관련 업체
- 콘텐츠 관련 업체.
신청자가 어느정도 되면 5월중에 관련 간담회나 설명회를 간단히 열 계획입니다.
Search Engine Platform의 자세한 내용과 open api 포맷은 정리되는 대로 하루 이틀내로 바로 공개하겠습니다.
http://gaia.gruter.com

휴. 뭘하나 만들어 내는것은 이제 벅찬일인듯 합니다.
머리도 안돌고, 코딩은 더욱 어눌하고.
주위에서 도움을 받고 많은 라이브러리를 가져다 썼음에도 불구하고 어려운건 어렵군요.
**/
몇가지 구상을 하고 필요한 플래폼을 준비중에 있습니다.
이제 그 첫번째로 Search Engine Plaform을 조심스레 선보입니다.
일반개발자들에게 검색엔진을 도입하거나 접목하는 일은 그리 쉬운일은 아닙니다.
database를 많이 다루던 사람들에게도 항상 불만인것이 그놈의 Like 검색입니다.
게다가 키워드에 대한 랭킹이 들어가면 손을 들수 밖에 없습니다.
또한 소규모나 대규모의 기업에게 있어서 검색엔진의 도입은 상당한 비용과 많은 튜닝작업으로 많은 투자가 일어나게 됩니다.
최근에 아마존의 simpleDB나 구글의 AppEngine의 등장은 상당히 고무적인것이긴 하나 그것들은 spread sheet류의 작은 String 데이터만을 다루기 때문에 fulltext 검색기능을 제공하지는 않는듯 합니다.
이러한 부분에 도움이 되고자 Search Engine Platform을 준비했습니다.
사실 아직 플랫폼이라 명명하기에는 부족한면이 많이 있지만 그래도 플래폼이 되고 싶어 계속 발전할 것입니다.
모든 데이터를 담고 싶어서 "대지의 여신"이라는 GAIA(가이아)로 명명하였습니다.(가칭)
GAIA 서비스는 클라우드컴퓨팅과 클라우드스토리지기반으로 돌아가므로 클라우드 데이터서비스가 가질수 있는 장점을 대부분 담으려고 합니다.
이제 막 테스트를 해야 하는 상황이므로 클로우즈베타로 5-6월정도 운영해볼까 합니다.
그 와중에 많은 문제점과 개선점이 생기겠지요.
검색플래폼을 개선해 나가는 동안 두번째와 세번째 플래폼도 하나씩 선보일 예정입니다.
검색플래폼은 말 그대로 "검색"에 중점을 두었기 때문에 다른 기능상의 장점들은 덜 부각시키려 합니다.
그 기능상의 장점들은 다른 플래폼에서 부각되어 알려질겁니다.
GAIA 검색플래폼은 기본적인 테스트와 관리를 위한 "웹 브라우저"를 통한 접근과 개발자가 직접 데이터를 입출력하고 검색기능을 구현할 수 있는 "OPEN API"를 통한 접근으로 이루어져 있습니다.
OpenApi를 통해서는 여러가지 검색튜닝을 시도해 볼수 있습니다.
클로우즈베타 기간에는 브라우저로는 누구나 테스트해볼수 있으나
OPEN API는 승인된 개발자에게만 접근이 허용됩니다.
그래서 클로우즈베타를 위한 개발자와 관련자들의 신청을 받습니다.
신청은 가입을 하시고 이 블로그에 덧글을 달거나 drgru@hotmail.com으로 메일주시면 됩니다.
위 이메일 주소로 msn 접속도 가능합니다.
신청양식은 그냥 자유롭게 해주시면 됩니다.(누구고, 어느정도의 데이터를 어떻게 해보고 싶은 정도... 그렇지만 그냥 단순한 테스트는 허용되지 않습니다. 목적이 있는 테스트의 경우에만 open api 접근이 허용됩니다.)
그루터는 당분간 일반인 대상 서비스를 만들기보단 그러한 서비스를 만드는데 지원할수 있는 시스템에 주력할 생각입니다.
그래서
다음과 같은 분들이 함께 해봤으면 좋겠습니다.
- 검색 서비스 개발자
- 데이터 관련 개발자
- 쇼핑검색 관련 업체
- 콘텐츠 관련 업체.
신청자가 어느정도 되면 5월중에 관련 간담회나 설명회를 간단히 열 계획입니다.
Search Engine Platform의 자세한 내용과 open api 포맷은 정리되는 대로 하루 이틀내로 바로 공개하겠습니다.
http://gaia.gruter.com
그냥 지나쳤던것이 어제 한 지인이 야후에 대해 불평하면서 이래가지고서야... 이러더군.
의도적이던 실수던 간에 뭔가 불편한것은 맞는듯 하다.
야후 관계자가 이글을 본다면 수정하는게 맞지 않을까 싶은데...
(의도적인것이라 한다면 사용자에 따라 느낌이 다를테니까 알아서 하시고^^ 불편하게 느끼는 사람은 투덜되면서 불편하게 생각하겠지.)
아래처럼 처음 들어가면 "뉴스 홈"이라 찍힌 메뉴가

다른 메뉴로 마우스를 가져다 두면 "주요뉴스"로 바뀐다..(물론 다시 주요뉴스로 마우스가 가면 "뉴스 홈"으로 다시 바뀌고.. 아 헛갈려...)

작은 차이가 명품을 만드는 법인데...
의도적이던 실수던 간에 뭔가 불편한것은 맞는듯 하다.
야후 관계자가 이글을 본다면 수정하는게 맞지 않을까 싶은데...
(의도적인것이라 한다면 사용자에 따라 느낌이 다를테니까 알아서 하시고^^ 불편하게 느끼는 사람은 투덜되면서 불편하게 생각하겠지.)
아래처럼 처음 들어가면 "뉴스 홈"이라 찍힌 메뉴가
다른 메뉴로 마우스를 가져다 두면 "주요뉴스"로 바뀐다..(물론 다시 주요뉴스로 마우스가 가면 "뉴스 홈"으로 다시 바뀌고.. 아 헛갈려...)
작은 차이가 명품을 만드는 법인데...
블로그를 검색한다는 것은 알고싶은 노하우나 새로운 소식에 대해서 일수도 있지만
검색 결과의 대상이 되는 사람에 대한 느낌을 받아들이고 싶을때가 있다.
클라우드로 표현되는 블로그서비스들의 태그구름들이 이러한 느낌을 전달할 수도 있겠지만 나같은 유저는 그러한 정형화되지 않은 뭉게구름이 산만하게만 느껴지고 정보로서 보이질 않는다.
게다가 태그를 쓰지 않는 나같은 블로거는 보여줄 태그구름도 없다.
오늘 보니 야후의 블로그검색이 바뀌었다.
디자인이나 인터페이스의 변화가 없어 느끼지 못할만 함에도 불구하고 눈에 띄게 변화된 모습이 보인다.
세분화 됨과 동시에 "주제어"라고 하는 새로운 시도가 이루어지고 있다.
이 주제어가 정확도를 인정할 만큼 한눈에 들어오게 된다면 이 주제어를 통하여 해당 블로그를 느껴볼수도 있을 것이다.
아마도 더 많은 클릭률이 일어나게 될것으로 보인다.
글수나 참조 수 등의 항목이 늘어나고 세분화된것을 보아하니, 이것들이 좀 더 정확하게 분석되고 랭킹에 반영되었나 보다.(jaso블로그가 왜 나보다 훨 높아진겨...)
하나의 서비스를 만들고 운영하며 발전해 나간다는 것은 많은 인내와 노력과 비용이 들어간다.
야후블로그 검색서비스도 세상에 나온지 몇해가 되어가나 보다.
지속적으로 발전하는 모습을 계속 볼수 있음 좋겠다.
(스킨을 바꾸느라 블로그랭킹을 안달았는데 다시 설치해야겠군... 걍 티스토리 플러그인으로 제공해 줄것이지 쩝.)


검색 결과의 대상이 되는 사람에 대한 느낌을 받아들이고 싶을때가 있다.
클라우드로 표현되는 블로그서비스들의 태그구름들이 이러한 느낌을 전달할 수도 있겠지만 나같은 유저는 그러한 정형화되지 않은 뭉게구름이 산만하게만 느껴지고 정보로서 보이질 않는다.
게다가 태그를 쓰지 않는 나같은 블로거는 보여줄 태그구름도 없다.
오늘 보니 야후의 블로그검색이 바뀌었다.
디자인이나 인터페이스의 변화가 없어 느끼지 못할만 함에도 불구하고 눈에 띄게 변화된 모습이 보인다.
세분화 됨과 동시에 "주제어"라고 하는 새로운 시도가 이루어지고 있다.
이 주제어가 정확도를 인정할 만큼 한눈에 들어오게 된다면 이 주제어를 통하여 해당 블로그를 느껴볼수도 있을 것이다.
아마도 더 많은 클릭률이 일어나게 될것으로 보인다.
글수나 참조 수 등의 항목이 늘어나고 세분화된것을 보아하니, 이것들이 좀 더 정확하게 분석되고 랭킹에 반영되었나 보다.(jaso블로그가 왜 나보다 훨 높아진겨...)
하나의 서비스를 만들고 운영하며 발전해 나간다는 것은 많은 인내와 노력과 비용이 들어간다.
야후블로그 검색서비스도 세상에 나온지 몇해가 되어가나 보다.
지속적으로 발전하는 모습을 계속 볼수 있음 좋겠다.
(스킨을 바꾸느라 블로그랭킹을 안달았는데 다시 설치해야겠군... 걍 티스토리 플러그인으로 제공해 줄것이지 쩝.)
가끔씩 네이버에 들르면 격월인지 분기별인지는 몰라도 네이버 검색트렌드 인가 하는 작은 소책자를 만날수 있었다.
그걸 보고 참으로 멋있고 부럽다 생각했었다.
이것의 세부내용을 볼수 있으면 얼마나 좋을까 하는 생각들이 계속해서 맴돌고 있었는데
지난주인가 의미있는 소식을 접했다.
2008년 Naver Trend Annual Book이다.
http://book.naver.com/themebook/trend/
다행히 웹에서 전문을 공개하고 있다.
그렇지만 난 꼭 책을 구해봐야겠다.
콘텐츠를 다루는 사람이라면 이정도의 자료들은 무조건 욕심이 있어야 할것이다.
오랜만에 네이버의 멋진 모습을 보았다.

그걸 보고 참으로 멋있고 부럽다 생각했었다.
이것의 세부내용을 볼수 있으면 얼마나 좋을까 하는 생각들이 계속해서 맴돌고 있었는데
지난주인가 의미있는 소식을 접했다.
2008년 Naver Trend Annual Book이다.
http://book.naver.com/themebook/trend/
다행히 웹에서 전문을 공개하고 있다.
그렇지만 난 꼭 책을 구해봐야겠다.
콘텐츠를 다루는 사람이라면 이정도의 자료들은 무조건 욕심이 있어야 할것이다.
오랜만에 네이버의 멋진 모습을 보았다.
클라우드가 뭡니까?
글쎄 잘 모르겠군요.
제가 관심을 같은것은 데이터처리영역이라 코에걸면 코걸이가 되는 컨셉의 문제는 뭐라 할 얘기가 없군요.
대신 이제는 해야한다는 것은 말씀드릴수 있겠군요.
http://blog.sdnkorea.com/blog/774
썬이 자신의 클라우드 전략에 대해 내 놓은것이 있습니다.
http://www.slideshare.net/guest829442/cloud-computing-sun-vision-03262009?type=presentation
http://sunevent.co.kr/edm/down/cloud_computing_primer.pdf
글쎄 잘 모르겠군요.
제가 관심을 같은것은 데이터처리영역이라 코에걸면 코걸이가 되는 컨셉의 문제는 뭐라 할 얘기가 없군요.
대신 이제는 해야한다는 것은 말씀드릴수 있겠군요.
http://blog.sdnkorea.com/blog/774
썬이 자신의 클라우드 전략에 대해 내 놓은것이 있습니다.
http://www.slideshare.net/guest829442/cloud-computing-sun-vision-03262009?type=presentation
http://sunevent.co.kr/edm/down/cloud_computing_primer.pdf
Prev
Rss Feed