2010년 6월, 구글은 웹사이트 콘텐츠 색인 관리를 위한 새로운 내부 메커니즘인 "카페인(Caffeine)"을 공개했습니다. 카페인은 새롭게 개발된 검색 색인의 이름입니다.
카페인은 이전 인덱스보다 최대 50% 더 최신 검색 결과를 제공합니다. 또한 사용자에게 제공하는 온라인 자료 중 가장 방대한 컬렉션을 자랑합니다. 뉴스 기사, 블로그 게시물, 포럼 게시물 등 콘텐츠 유형에 관계없이 게시 직후 관련 자료 링크를 훨씬 더 빨리 찾을 수 있습니다. 이전에는 제대로 작동하지 않았습니다.
구글 카페인
처럼 검색 자체나 결과 목록을 수정하는 기존 업데이트 방식이 아닙니다 펭귄 . 대신, 구글 카페인은 검색 결과 표시 방식을 변경합니다. 이 업데이트는 2010년 6월 처음 적용되면서 구글의 인프라에 상당한 변화를 가져왔습니다. 또한, 월드 와이드 웹과 방대한 멀티미디어 자료의 등장도 이 업데이트 출시의 중요한 요인이었습니다.
월드 와이드 웹은 동영상, 정지 이미지, 팟캐스트, 뉴스 피드 등 다양한 콘텐츠를 제공합니다. 구글 카페인은 최신 기술 발전에 발맞춰 개발되었으며, 특히 크롤링 과정과 정보 제공 사이의 소요 시간을 단축하는 데 중점을 두었습니다.
구글 카페인의 기능은 무엇인가요?
새로운 웹 색인 기술은 카페인(Caffeine)으로 알려졌습니다. 구글은 이 새로운 기술을 사용하여 더 많은 데이터를 크롤링하고 저장할 수 있었습니다. 구글의 발표에 따르면, 그 결과 회사는 색인을 확장하고 훨씬 더 최신의 검색 결과를 제공할 수 있게 되었습니다.
이전의 색인 방식에서는 페이지와 콘텐츠 유형을 자료의 최신성 필요성에 따라 범주로 분류했습니다. 이 모든 것은 해당 호의 정보 분류 체계에 따라 이루어졌습니다. 따라서 여러 개의 크롤러가 투입되었는데, 일부는 변경 사항을 찾고 다른 일부는 변경된 사이트를 재색인했습니다.
웹사이트가 "최신" 카테고리에 속하면 다양한 봇이 해당 웹사이트를 크롤링하여 정보를 색인에 추가합니다. 하지만 대부분의 웹사이트는 약 2주에 한 번 정도만 콘텐츠가 색인화됩니다.
로 인해 관련성 높고 최신 정보가 색인에서 누락될 가능성을 초래합니다 사이트 최적화.
이제 구글은 웹사이트를 스캔하고 데이터를 수집하여 색인에 추가하는 작업을 단 몇 초 만에 처리할 수 있게 되었습니다. 카페인 덕분에 사용자들은 이제 훨씬 더 많은 웹사이트에서 훨씬 더 최신 정보를 접할 수 있게 되었습니다.
마지막으로
구글 카페인은 웹을 작은 단위로 분석하기 때문에, 수집한 정보를 바탕으로 검색 색인을 업데이트할 수 있습니다. 따라서 구글은 새로운 정보를 발견하면 즉시 색인에 반영할 수 있습니다. 이는 우리가 이전보다 더 최신 정보를 찾을 수 있게 해주고, 결과적으로 검색 사용자로서 더욱 만족감을 느끼게 해준다는 것을 의미합니다.
Seahawk는 용어를 더 잘 이해하는 데 도움이 되는 Google 용어집에 대해 자세히 설명합니다.