웨이백 머신은 인터넷 아카이브 산하의 아카이브 사이트이다. 한국에는 archive.today가 더 유명하지만 실제 규모는 웨이백 머신 쪽이 더 크며, 아카이빙 사이트 면에서의 터줏대감이자 세계 최대의 아카이브 사이트이다.
특징편집
전술하다시피 웨이백 머신은 ia-archiver
라는 로봇으로 사이트를 크롤링 하여 아카이빙 한다. 물론 사용자의 요청에 의해서 아카이빙을 할 수 있다. 크롤링을 한다는 특성상 robots.txt을 철저하게 지키며 전술한 ia-archiver
봇을 막은 사이트는 사용자가 요청해도 절대 아카이빙이 되지 않는다.
archive.today가 1024x768라는 구시대적 해상도로 고정하여 아카이빙을 하지만 이쪽은 웹페이지를 그냥 통째로 아카이빙 한다. 가령 반응형 웹페이지를 아카이빙 할 경우 실제로 아카이브도 반응형으로 아카이브가 되어 휴대폰 환경에서 최적화된 환경으로 볼 수 있다.
archive.today와 달리 운영 주체의 실체가 명확하기 때문에 서버가 archive.today와 비교할 수 없을 정도로 안정적이다. 당연히 클라우드플레어 1.1.1.1 DNS로 접속이 가능하다.
문제점편집
그러나 이 사이트의 문제점은 바로 버그. 유저 요청이 아닌 자체 크롤링을 중심으로 돌아가다 보니 유저 요청 크롤링에 대한 버그가 많다. 예를 들어 특정 페이지를 아카이빙 하려는데 아카이빙에 실패하거나, 아카이빙에 성공했는데도 엉뚱한 페이지를 뱉는 등 유저 요청 아카이빙은 버그 투성이이다.
하지만 이 문제점이 존재하더라도 성공적으로 아카이빙을 된다면 최대한 원본 페이지와 가깝게 페이지를 감상할 수 있으며 안정적인 서버에서 아카이빙을 감상할 수 있다.