Archive for the 'Археоблог' Category

Археоблогот on-line

Ете, за да не се каже дека само теоретизираме, го ставив on-line она што успеав досега да го извлечам од bloger.com.mk платформата на следнава привремена адреса: http://arheo.infomatrix.com.mk.

Хостот е дониран од мојата компанија Инфопројект, a „Инфоматрикс“ е нашиот најнов продукт, кој претставува комплетно, web-базирано ентерпрајс решение за големи компании. [Малку самореклама, ете – незгодно ми е веќе]

На сајтот се постовите кои ги извлече мојата автоматизирана процедура, иако авторката вели дека недостасуваат уште 30-40 текстови. Програмата што ја напишав ги парсираше архивите, и по неколку повторени пуштања, добивав ист број на постови кои се појавуваат таму. Не гледам друг начин да ги добијам перманентните линкови на оние содржини кои фалат. Ако некој измисли нешто или му текне како, нека напише овде.

Сметајте ја инсталацијата за привремена. На постовите им треба уште малку прочистување со HTML Tidy. Исто така, треба да се поправат линковите до сликите кои веќе ги симнав. Сега се гледаат само сликите кои се линкувани од некој друг сајт, а не оние кои биле аплоудирани. Но, не би требало тоа да биде голем проблем. Ќе го средам веројатно до крајов на викендот.

Темата која е инсталирана за приказ на блогот е бесплатна, се вика Simplicity, и е позајмена од http://themes.performancing.com/.

Отворив и нова категорија на блогов – Археоблог, за да се групираат постовите околу оваа работа.

Advertisements

Археоблогот ископан!

Прогрес!
Си седнав синоќа да размислам за проблемов.
Малку cUrl, малку xPath, и ја завршив работата. Сите постови, комплет со наслови, датуми и категории се симнати кај мене во база.
Сега останува уште да ги префрлам („прекнижам“, што би рекол мојов колега Бранко, хехе) во WP, но стана доцна, всушност рано – 3am, па решив да си легнам за да го издржам денешниов ден.
Инаку, web-scraping-от го научив, од потреба, пред неколку години. Тогаш сеуште не постоеше клучниот xPath – со кој може лесно и брзо да се достапува до DOM-от на секој (X)HTML и XML документ. Многу помага и cURL, а особено ми се допаѓа можноста да се достапува до сајтовите со googlebot user agent, така што евентуално вградените алармни системи на серверот поради интензивен достап од една IP адреса нема да се вклучат.

Неколку функции, малку зезање, малку повеќе гледање на сорсот на сајтот (очај, windows-1251, инаку добро среден HTML). Треба уште да поработам да ги симнам сликите кои се вчитани во сајтот (т.е. не се линкувани на некое место).

Денес-утре ќе направам привремена WP инсталација на некој од серверите на мојава фирма, за да може „археологињата“ да провери дали е се` во ред.

Археоблогот бара помош

Здарво на сите WP корисници, и цел Macedonian WP Team. Пред неполн час од страна на сопственичката на Археоблогот, како член на Macedonian WP Team, и како корисник на WP платформа бев официално замолен за помош во “реновирање” на нејзиниот блог. Нов изглед, и се попратно со самиот изглед.

Доколку има заинтересирани, WP корисници, дизајнери, кодери, кои имаат барем малку слободно време и добра душа за помош, сите тие се добредојдени. Добредојдени се и било какви идеи кој би помогнале во подобар изглед и преформанси на блогот.

За контакт со сопственичката овде, и секако коментарите кои се добредојдени.