30 lines
1.1 KiB
PHP
30 lines
1.1 KiB
PHP
|
<?php
|
||
|
return array(
|
||
|
'grabber' => array(
|
||
|
'%.*%' => array(
|
||
|
'test_url' => 'https://en.wikipedia.org/wiki/Grace_Hopper',
|
||
|
'body' => array(
|
||
|
'//div[@id="bodyContent"]',
|
||
|
),
|
||
|
'strip' => array(
|
||
|
"//div[@id='toc']",
|
||
|
"//div[@id='catlinks']",
|
||
|
"//div[@id='jump-to-nav']",
|
||
|
"//div[@class='thumbcaption']//div[@class='magnify']",
|
||
|
"//table[@class='navbox']",
|
||
|
"//table[contains(@class, 'infobox')]",
|
||
|
"//div[@class='dablink']",
|
||
|
"//div[@id='contentSub']",
|
||
|
"//div[@id='siteSub']",
|
||
|
"//table[@id='persondata']",
|
||
|
"//table[contains(@class, 'metadata')]",
|
||
|
"//*[contains(@class, 'noprint')]",
|
||
|
"//*[contains(@class, 'printfooter')]",
|
||
|
"//*[contains(@class, 'editsection')]",
|
||
|
"//*[contains(@class, 'error')]",
|
||
|
"//span[@title='pronunciation:']",
|
||
|
),
|
||
|
)
|
||
|
)
|
||
|
);
|