잘 하는 자를 보고 벤치마킹 하고 그의 패턴과 비슷하게 따라 해보는 것도 잘하는 방법중의 하나이다.
꼭 1등일 필요있나?
경우에 따라서는 자신의 독창성이 첨부된 그의 패턴이 더 나을 수도 있지.
웹 문서 검색도 마찬가지이다.
이미 잘하는 데가 있다.
구글도 있고 야후도 있다.
그럼 이들을 벤치마킹하고 자신의 독창성을 첨부한다면 또다른 시각의 "잘하는 웹검색"이 될수 있다.
1. 크롤을 열심히 하여 웹문서를 다량 확보한다.
2. 나름의 알고리즘을 이용하여 이 문서의 랭킹들을 적용한다.
그러나 스스로를 믿지는 마라.
3. 10만 정도의 쿼리를 구한다.
4. 그 쿼리로 구글에 검색하여 웹문서를 랭킹하고 네이버, 야후에 검색하여 바로가기를 채어온다.
5. 구글 웹문서 검색랭킹, 네이버, 야후의 바로가기 랭킹을 자신의 알고리즘에 덧셈을 한다.
그 가중치는 알아서 한다.
6. 새로운 쿼리가 들어오면 위와 같은 방식으로 처리한다. 굳이 실시간일 필요는 없다.
웬만한 사람들은 검색결과에서 2페이지를 넘기질 않는다.
이런 방법을 쓰면 어디에 뒤지지 않는 웹문서 검색결과를 제공할수 있다.
이정도면 사람들이 아 거기 검색결과 훌륭하던데... 반응 나온다.
문제는 10억건이든 20억건이든 처리할 돈이다. 쩝...
꼭 1등일 필요있나?
경우에 따라서는 자신의 독창성이 첨부된 그의 패턴이 더 나을 수도 있지.
웹 문서 검색도 마찬가지이다.
이미 잘하는 데가 있다.
구글도 있고 야후도 있다.
그럼 이들을 벤치마킹하고 자신의 독창성을 첨부한다면 또다른 시각의 "잘하는 웹검색"이 될수 있다.
1. 크롤을 열심히 하여 웹문서를 다량 확보한다.
2. 나름의 알고리즘을 이용하여 이 문서의 랭킹들을 적용한다.
그러나 스스로를 믿지는 마라.
3. 10만 정도의 쿼리를 구한다.
4. 그 쿼리로 구글에 검색하여 웹문서를 랭킹하고 네이버, 야후에 검색하여 바로가기를 채어온다.
5. 구글 웹문서 검색랭킹, 네이버, 야후의 바로가기 랭킹을 자신의 알고리즘에 덧셈을 한다.
그 가중치는 알아서 한다.
6. 새로운 쿼리가 들어오면 위와 같은 방식으로 처리한다. 굳이 실시간일 필요는 없다.
웬만한 사람들은 검색결과에서 2페이지를 넘기질 않는다.
이런 방법을 쓰면 어디에 뒤지지 않는 웹문서 검색결과를 제공할수 있다.
이정도면 사람들이 아 거기 검색결과 훌륭하던데... 반응 나온다.
문제는 10억건이든 20억건이든 처리할 돈이다. 쩝...

Prev
Rss Feed