Advertisement
Urbanecm

Untitled

Sep 28th, 2022
171
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 77.88 KB | None | 0 0
  1. {
  2. "cells": [
  3. {
  4. "cell_type": "code",
  5. "execution_count": 1,
  6. "id": "83d52f1b",
  7. "metadata": {},
  8. "outputs": [],
  9. "source": [
  10. "from wmfdata import spark, mariadb, hive\n",
  11. "import wmfdata\n",
  12. "from datetime import datetime\n",
  13. "import numpy as np\n",
  14. "import pandas as pd\n",
  15. "import re\n",
  16. "\n",
  17. "from IPython.display import display, Markdown, Latex, HTML\n",
  18. "from pyspark.sql import functions as F, types as T, Window\n",
  19. "\n",
  20. "pd.set_option('display.max_colwidth', None)\n",
  21. "pd.set_option('display.width', None)\n",
  22. "pd.set_option('display.max_rows', None)\n",
  23. "pd.set_option('display.max_columns', None)"
  24. ]
  25. },
  26. {
  27. "cell_type": "code",
  28. "execution_count": 2,
  29. "id": "e0b5e296",
  30. "metadata": {},
  31. "outputs": [],
  32. "source": [
  33. "RE_IMAGE = re.compile(r'\\[\\[(Soubor|Image|File):(.*)\\]\\]$', flags=re.MULTILINE)\n",
  34. "RE_CAPTION = re.compile(r'^[^|]*\\|((náhled|thumb|vpravo|right|vlevo|left|střed|center|upright=?[0-9.]*|[0-9]+(x[0-9]+)?(px|pixelů))\\|?)*')\n",
  35. "RE_ALT = re.compile(r'\\|alt=[^]]*')\n",
  36. "RE_NBSP = re.compile(r' ')"
  37. ]
  38. },
  39. {
  40. "cell_type": "code",
  41. "execution_count": 32,
  42. "id": "4b554bdb",
  43. "metadata": {},
  44. "outputs": [],
  45. "source": [
  46. "featured_articles = mariadb.run('''\n",
  47. "SELECT page_id\n",
  48. "FROM categorylinks\n",
  49. "JOIN page ON cl_from=page_id\n",
  50. "WHERE\n",
  51. " -- only featured articles\n",
  52. " cl_to='Wikipedie:Nejlepší_články'\n",
  53. " \n",
  54. " -- limit to main namespace\n",
  55. " AND page_namespace=0\n",
  56. "''', 'cswiki')\n",
  57. "\n",
  58. "featured_article_sql_cond = ' OR '.join(['page_id=%s' % x for x in featured_articles.page_id])"
  59. ]
  60. },
  61. {
  62. "cell_type": "code",
  63. "execution_count": 19,
  64. "id": "3da82a1b",
  65. "metadata": {},
  66. "outputs": [],
  67. "source": [
  68. "small_articles = mariadb.run('''\n",
  69. "SELECT page_id\n",
  70. "FROM page\n",
  71. "WHERE\n",
  72. " page_len < 5000\n",
  73. " AND page_namespace=0\n",
  74. " AND page_is_redirect=0\n",
  75. " \n",
  76. " AND page_id IN (\n",
  77. " SELECT il_from\n",
  78. " FROM imagelinks\n",
  79. " WHERE il_from_namespace=0\n",
  80. " )\n",
  81. "\n",
  82. "ORDER BY page_len DESC\n",
  83. "LIMIT 100\n",
  84. "''', 'cswiki')\n",
  85. "small_article_sql_cond = ' OR '.join(['page_id=%s' % x for x in small_articles.page_id])"
  86. ]
  87. },
  88. {
  89. "cell_type": "code",
  90. "execution_count": 5,
  91. "id": "30b17593",
  92. "metadata": {},
  93. "outputs": [
  94. {
  95. "name": "stderr",
  96. "output_type": "stream",
  97. "text": [
  98. "PySpark executors will use /usr/lib/anaconda-wmf/bin/python3.\n"
  99. ]
  100. }
  101. ],
  102. "source": [
  103. "sparkSession = spark.get_session(type='regular', app_name='image-caption-length')"
  104. ]
  105. },
  106. {
  107. "cell_type": "code",
  108. "execution_count": 34,
  109. "id": "eafb9ffe",
  110. "metadata": {},
  111. "outputs": [],
  112. "source": [
  113. "images_data = (\n",
  114. " sparkSession.read.table('wmf.mediawiki_wikitext_current')\n",
  115. " .where(F.col('snapshot') == '2021-07')\n",
  116. " .where(F.col('wiki_db') == 'cswiki')\n",
  117. " .where(F.col(\"page_namespace\") == 0)\n",
  118. " #.where((F.col('page_id') == 1263886) | F.expr(featured_article_sql_cond))\n",
  119. " .where(F.expr(featured_article_sql_cond) | F.expr(small_article_sql_cond))\n",
  120. " .where(F.col(\"revision_text\").isNotNull())\n",
  121. ")"
  122. ]
  123. },
  124. {
  125. "cell_type": "code",
  126. "execution_count": 21,
  127. "id": "3a31a510",
  128. "metadata": {},
  129. "outputs": [],
  130. "source": [
  131. "def get_images(r):\n",
  132. " images = [m[1] for m in RE_IMAGE.findall(r.revision_text)]\n",
  133. " return T.Row(\n",
  134. " page_id=r.page_id,\n",
  135. " page_title=r.page_title,\n",
  136. " revision_id=r.revision_id,\n",
  137. " images=images,\n",
  138. " num_images=len(images)\n",
  139. " )"
  140. ]
  141. },
  142. {
  143. "cell_type": "code",
  144. "execution_count": 22,
  145. "id": "e62f57fd",
  146. "metadata": {},
  147. "outputs": [],
  148. "source": [
  149. "def get_captions(r):\n",
  150. " captions_all = [RE_ALT.sub('', RE_CAPTION.sub('', i)) for i in r.images]\n",
  151. " captions = [c for c in captions_all if c != ''] # ignore images with no caption at all\n",
  152. "\n",
  153. " return T.Row(\n",
  154. " page_id=r.page_id,\n",
  155. " page_title=r.page_title,\n",
  156. " revision_id=r.revision_id,\n",
  157. " captions=captions,\n",
  158. " num_captions=len(captions)\n",
  159. " )"
  160. ]
  161. },
  162. {
  163. "cell_type": "code",
  164. "execution_count": 23,
  165. "id": "6023bdc3",
  166. "metadata": {},
  167. "outputs": [],
  168. "source": [
  169. "def add_details_to_captions(r):\n",
  170. " captions_lens = [len(c) for c in r.captions]\n",
  171. " clean_captions = [RE_NBSP.sub(' ', c) for c in r.captions]\n",
  172. " clean_captions_lens = [len(c) for c in clean_captions]\n",
  173. "\n",
  174. " return T.Row(\n",
  175. " page_id=r.page_id,\n",
  176. " page_title=r.page_title,\n",
  177. " revision_id=r.revision_id,\n",
  178. " captions=r.captions,\n",
  179. " num_captions=r.num_captions,\n",
  180. " avg_caption_len=float(np.mean(captions_lens)),\n",
  181. " avg_clean_caption_len=float(np.mean(clean_captions_lens)),\n",
  182. " median_caption_len=float(np.median(captions_lens)),\n",
  183. " median_clean_caption_len=float(np.median(clean_captions_lens))\n",
  184. " )"
  185. ]
  186. },
  187. {
  188. "cell_type": "code",
  189. "execution_count": 35,
  190. "id": "d2228771",
  191. "metadata": {},
  192. "outputs": [],
  193. "source": [
  194. "images_captions = sparkSession.createDataFrame(\n",
  195. " images_data.rdd\n",
  196. " .map(get_images)\n",
  197. " .filter(lambda r: r.num_images > 0)\n",
  198. " .map(get_captions)\n",
  199. " .filter(lambda r: r.num_captions > 0)\n",
  200. " .map(add_details_to_captions)\n",
  201. ")\n",
  202. "df = images_captions.toPandas()"
  203. ]
  204. },
  205. {
  206. "cell_type": "code",
  207. "execution_count": 36,
  208. "id": "e7b90586",
  209. "metadata": {},
  210. "outputs": [
  211. {
  212. "data": {
  213. "text/plain": [
  214. "255"
  215. ]
  216. },
  217. "execution_count": 36,
  218. "metadata": {},
  219. "output_type": "execute_result"
  220. }
  221. ],
  222. "source": [
  223. "df.page_id.count()"
  224. ]
  225. },
  226. {
  227. "cell_type": "code",
  228. "execution_count": 38,
  229. "id": "4d13ba61",
  230. "metadata": {},
  231. "outputs": [
  232. {
  233. "data": {
  234. "text/html": [
  235. "<div>\n",
  236. "<style scoped>\n",
  237. " .dataframe tbody tr th:only-of-type {\n",
  238. " vertical-align: middle;\n",
  239. " }\n",
  240. "\n",
  241. " .dataframe tbody tr th {\n",
  242. " vertical-align: top;\n",
  243. " }\n",
  244. "\n",
  245. " .dataframe thead th {\n",
  246. " text-align: right;\n",
  247. " }\n",
  248. "</style>\n",
  249. "<table border=\"1\" class=\"dataframe\">\n",
  250. " <thead>\n",
  251. " <tr style=\"text-align: right;\">\n",
  252. " <th></th>\n",
  253. " <th>avg_caption_len</th>\n",
  254. " <th>avg_clean_caption_len</th>\n",
  255. " <th>captions</th>\n",
  256. " <th>median_caption_len</th>\n",
  257. " <th>median_clean_caption_len</th>\n",
  258. " <th>num_captions</th>\n",
  259. " <th>page_id</th>\n",
  260. " <th>page_title</th>\n",
  261. " <th>revision_id</th>\n",
  262. " </tr>\n",
  263. " </thead>\n",
  264. " <tbody>\n",
  265. " <tr>\n",
  266. " <th>75</th>\n",
  267. " <td>476.000000</td>\n",
  268. " <td>467.250000</td>\n",
  269. " <td>[V&amp;nbsp;řase ''[[Chlamydomonas]]'' byla poprvé dokázána přítomnost plastidové DNA&lt;br /&gt;(zvětšení: 10&amp;nbsp;000×, [[rastrovací elektronový mikroskop]]), Obecné schéma chloroplastové DNA: [[small single copy|SSC]] (small single copy), dva regiony [[Palindrom (genetika)|inverted repeats]]&amp;nbsp;a [[large single copy|LSC]] (large single copy), 1.3|[[Ribozom]] v&amp;nbsp;chloroplastech slouží k&amp;nbsp;[[translace (biologie)|translaci]] RNA, která vznikla [[Transkripce (DNA)|přepisem]] pDNA, Na tomto [[fylogenetický strom|fylogenetickém stromu]] [[eukaryota|eukaryot]] je zachycena jedna z&amp;nbsp;představ, jak vznikaly [[plastid]]y. Modrá šipka od bakterií ke skupině ''[[rostliny|Archaeplastida]]'' znázorňuje primární endosymbiózu, zbylé dva červené proužky znázorňují endosymbiózu sekundární&lt;br /&gt;(představa o&amp;nbsp;vzniku plastidů dle&lt;ref&gt;{{Citace periodika | doi = 15306349| issn = 0962-8452| ročník = 271| číslo = 1545| strany = 1251–62| autor= Cavalier-Smith, Thomas| titul = Only six kingdoms of life| periodikum = Proceedings. Biological Sciences / The Royal Society| rok = 2004| url = http://www.ncbi.nlm.nih.gov/pubmed/15306349 |jazyk=anglicky}}&lt;/ref&gt;, aktualizace systému dle&lt;ref name=\"adl\"&gt;{{citace periodika | autor = Adl, Sina M., et al | titul = The New Higher Level Classification of Eukaryotes with Emphasis on the Taxonomy of Protists | periodikum = Journal of Eukaryotic Microbiology | rok = 2005 | ročník = 52 | číslo = 5 | strany = 399–451 | url = http://www.blackwell-synergy.com/doi/abs/10.1111/j.1550-7408.2005.00053.x | jazyk = anglicky | příjmení = | jméno = | datum přístupu = 2009-03-14 | url archivu = https://web.archive.org/web/20170914143519/http://www.blackwell-synergy.com/doi/abs/10.1111/j.1550-7408.2005.00053.x | datum archivace = 2017-09-14 | nedostupné = ano }} {{Wayback|url=http://www.blackwell-synergy.com/doi/abs/10.1111/j.1550-7408.2005.00053.x |date=20170914143519 }}&lt;/ref&gt;)]</td>\n",
  270. " <td>167.5</td>\n",
  271. " <td>160.0</td>\n",
  272. " <td>4</td>\n",
  273. " <td>407355</td>\n",
  274. " <td>Plastidová DNA</td>\n",
  275. " <td>20161831</td>\n",
  276. " </tr>\n",
  277. " <tr>\n",
  278. " <th>233</th>\n",
  279. " <td>453.615385</td>\n",
  280. " <td>439.384615</td>\n",
  281. " <td>[alt=Malba muže středního věku od pasu nahoru, s&amp;nbsp;knírkem a malou úzkou špičatou bradkou, na hlavě má přiléhavou černou čapku s&amp;nbsp;výraznýma ušima po stranách, oblečen je v&amp;nbsp;přiléhavý světlý oděv ke krku|Portrét tchangského císaře [[Süan-cung]]a (vládl 712–756), alt=Mapa Číny v&amp;nbsp;hranicích kolem roku 745 (to jest vlastní Čína spolu s&amp;nbsp;dnešní provincií Kan-su a dnešní autonomní oblastí Sin-ťiang až k&amp;nbsp;Balchašskému jezeru), vyznačena jsou hlavní města Čchang-an a Luo-jang a obvody, sídla a počet vojáků deseti pohraničních velitelství na severní, západní a jihozápadní hranici|náhled|upright=2.5|Pohraniční vojenské oblasti v&amp;nbsp;říši Tchang, kolem roku 745. Uvedeny početnost vojsk, název a sídlo oblasti., alt=Mapa severovýchodní Číny, první ze série map dokumentujících průběh povstání: oblasti ovládané povstalci jsou červeně podbarveny, červené a žluté šipky značí pohyby vojsk, významná města jsou obarvena podle toho, kdo je drží, uvedena jsou jména generálů a místa bitev. Na této mapě jsou červeně obarveny oblasti Jing-čou, Fan-jangu a Luo-jangu, červené šipky značí postup povstalců na jih, žluté šipky tchangské protiútoky v&amp;nbsp;Che-peji a stahování vládních jednotek ze severozápadního pohraničí.|Prosinec 755 – leden 756: počáteční tažení povstalců, dobytí [[Kchaj-feng|Pien-čou]] a [[Luo-jang]]u. Tchangský protiútok v&amp;nbsp;Che-peji., alt=Černobílá kresba staršího muže s&amp;nbsp;dlouhým knírem a bradkou v&amp;nbsp;bohatě zřaseném rouchu s&amp;nbsp;širokými rukávy|Generál [[Kuo C’-i]], ilustrace z&amp;nbsp;knihy&lt;!-- 晩笑堂竹荘畫傳 --&gt; z&amp;nbsp;20. let 20. století, alt=Mapa severovýchodní Číny, druhá ze série map dokumentujících průběh povstání. Červeně je nyní obarven západní Che-pej, takže povstalci drží souvislé území, červené šipky míří mnoha směry, ale jsou odraženy, žluté šipky značí tchangské jednotky poslané na pomoc obléhanému Nan-jangu / Teng-čou na jihu.|Leden – únor 756: neúspěšné pokusy povstalců o&amp;nbsp;rozšíření území na jihu a východě, dobytí Cheng-čou na severu a tím obnovení spojení Fan-jangu s&amp;nbsp;Luo-jangem, alt=Mapa severovýchodní Číny, třetí ze série map dokumentujících průběh povstání. Odbarven byl západní Che-pej, takže oblast Fan-Jangu je opět rozpojena od Luo-jangu, Jing-čou přešlo na druhou stranu, takže je také odbarveno, řada šipek obou barev značí boje v&amp;nbsp;západním Che-peji.|Březen – červenec 756: tchangský protiútok v&amp;nbsp;Che-peji, stabilizace fronty na jihu, alt=Mapa severovýchodní Číny, čtvrtá ze série map dokumentujících průběh povstání. Červeně je obarveno souvislé území od Fan-Jangu až po Čchang-an, červené šipky jsou na jihu odraženy, žlutě přerušovaně je vyznačen ústup císaře na jihozápad do I-čou a jeho syna na severozápad do Ling-wu. Navíc je na této mapě uvedena výměna tchangských i&amp;nbsp;jenských císařů a na dolním okraji zelené šipky postupu Li Lina podél řeky Jang-c’-ťiang na východ k&amp;nbsp;Jang-čou.|Červenec 756 – listopad 757: Povstalci dobývají Čchang-an, Tchangové ustupují na jiho- a severozápad. Neúspěšné tchangské pokusy o&amp;nbsp;znovudobytí Čchang-anu, neúspěchy povstalců při snaze o&amp;nbsp;postup na jih a východ. Povstání Li Lina na jihu., alt=Malba řady jezdců na hedvábném svitku, kolona se vine hornatým terénem, první jezdci dojeli k&amp;nbsp;mostku, který je umístěn dole uprostřed|''Putování císaře [[Süan-cung|Ming-chuanga]]{{#tag:ref|Ming-chuang je posmrtné jméno císaře [[Süan-cung]]a (vládl 712–756).|group=pozn.}} do S’-čchuanu'', pozdně mingská kopie díla [[Čchiou Jing]]a (1494–1552), alt=Mapa severovýchodní Číny, pátá ze série map dokumentujících průběh povstání. Červeně je obarven již jen Luo-jang a okolí Siang-čou, červené šipky značí ústup povstalců, žluté šipky postup vládních sil na východ, nejdříve čerchovaně pro cestu ujgurských posil, od Ling-wu přes Čchang-an již plnou čarou. Fan-jang je fialový a fialová šipka na jih k&amp;nbsp;Siang-čou značí útok Š’ S’-minga.|Listopad 757 – duben 759: Tchangové dobývají Čchang-an a Luo-jang (757), povstalci An Čching-süa obleženi v&amp;nbsp;jižním Che-peji (758), povstalci v&amp;nbsp;severním Che-peji (Š’ S’-ming) přecházejí na tchangskou stranu. Na jaře 759 úspěšný útok Š’ S’-minga proti Tchangům i&amp;nbsp;An Čching-süovi., alt=Fotografie malé keramické figurky muže na koni, kůň je hnědý se světlou hřívou, jezdec oblečený v&amp;nbsp;hnědý oděv se žlutými tečkami, má u&amp;nbsp;pasu meč, je otočený doleva a střílí z&amp;nbsp;(chybějícího) luku vzhůru|Tchangská keramická figurka střílejícího jízdního lučištníka, alt=Mapa severovýchodní Číny, šestá ze série map dokumentujících průběh povstání. Červeně je opět obarveno souvislé území od Fan-Jangu po Luo-jang, červené šipky značí postup Š’ S’-minga přes Pien-čou na Luo-jang, krátká žlutá taktický přesun Li Kuang-piho na protější břeh Žluté řeky. Navíc je na této mapě uvedena druhá výměna tchangských i&amp;nbsp;jenských císařů a na dolním okraji zeleně šestero povstání podél řeky Jang-c’-ťiang.|Duben 759 – říjen 762: Š’ S’-ming dobývá Luo-jang (759) a odráží Tchangy (761). Výměna císařů u&amp;nbsp;povstalců (duben 761) a Tchangů (květen 762). Zeleně protitchangská povstání na jihu., alt=Mapa severovýchodní Číny, sedmá ze série map dokumentujících průběh povstání. Červeně je vyznačen již jen Luo-jang, k&amp;nbsp;němu se ze tří směrů sbíhají žluté šipky, jediná červená čárkovaná čára se od něj klikatí k&amp;nbsp;severní hranici, podél její cesty je fialově uvedeno půl tuctu jmen|Říjen 762 – leden 763: Tchangové dobývají Luo-jang, ústup a útěk Š’ Čchao-iho na sever a jeho smrt na severní hranici. Povstalečtí generálové (fialově) přecházejí na tchangskou stranu., alt=Mapa Číny k&amp;nbsp;roku 763, vyznačeno je na několik desítek správních obvodů, každý se svým názvem, pět obvodů na severovýchodě země má název vyveden červeně|[[Říše Tchang|Tchangská Čína]] k&amp;nbsp;roku 763, rozdělení na správní obvody guvernérů ''[[ťie-tu-š’]]''. Území ''ťie-tu-š’'' potvrzených z&amp;nbsp;bývalých povstaleckých generálů vyznačena červenou kurzívou.]</td>\n",
  282. " <td>458.0</td>\n",
  283. " <td>438.0</td>\n",
  284. " <td>13</td>\n",
  285. " <td>1332471</td>\n",
  286. " <td>Povstání An Lu-šana</td>\n",
  287. " <td>19552527</td>\n",
  288. " </tr>\n",
  289. " <tr>\n",
  290. " <th>145</th>\n",
  291. " <td>424.705882</td>\n",
  292. " <td>404.705882</td>\n",
  293. " <td>[alt=Mapa Zabajkalska a Poamuří s uvedenými jmény kmenů a státních celků necházejících se v regionu. A sice Burjati a Evenkové v Zabajkalí, Dauři, Gogulové, Ďučeři, Natci a Giljaci od horního k dolnímu toku Amuru a Evenkové severně od Amuru. Ze států jsou uvedeny říše Čching (v jižním Mandžusku), Mongolský chanát (východní Mongolsko) a Korea (její severovýchodní cíp).|Kmeny Poamuří a Zabajkalska v polovině 17. století, alt=Barevná současná fotografie; v&amp;nbsp;centru a vpravo palisáda dvojnásobné výše člověka uprostřed s&amp;nbsp;dřevěnou patrovou věží s&amp;nbsp;věžičkou. Na pozadí vlevo přízemní dřevěné domky.|Ukázka opevnění ruských ostrohů v&amp;nbsp;17.&amp;nbsp;století. Jižní stěna [[Ilimsk|ilimského ostrohu]] s&amp;nbsp;věží z&amp;nbsp;roku 1667, přemístěná do muzea [[Talcy (muzeum)|Talcy]] u&amp;nbsp;[[Irkutsk]]a., alt=Mapa Zabajkalska a Poamuří s&amp;nbsp;vyznačenými směry pohybu Rusů (ze severu do Zabajkalí a k&amp;nbsp;Amuru, podél Amuru, od ústí Amuru po moři na sever), Čchingů (z&amp;nbsp;Ninguty a Girinu po Sungari na sever k&amp;nbsp;Amuru) a amurských kmenů (od Amuru na jih k&amp;nbsp;řekám Non a Sungari)|Akce Rusů (červeně), Čchingů (modře) a pohyb amurských kmenů na jih (zeleně) v&amp;nbsp;Zabajkalsku a&amp;nbsp;Poamuří v&amp;nbsp;letech 1652–1658, alt=Mapa Zabajkalska a Poamuří s černě vyznačenými ruskými sídly založenými do 60. let 17. století (Barguzinsk u Bajkalu, Irgensk, Telembinsk a Něrčinsk ve východním Zabajkalsku) a červeně vyznačenými ruskými sídly vzniklými v letech 1665–1681 (Jeravninsk v Zabajkalsku roku 1675), na horním Amuru Albazin (1665), na Zeje Verchnozejsk, Selemdžinsk a Dolonsk (1679–1681) a na severovýchodě u Ochotského moře Udsk (1679).|Ruská kolonizace Poamuří a východního Zabajkalska od 60. do počátku 80. let 17. století., alt=Barevná malba z přelomu 17. a 18. století; mladý muž v&amp;nbsp;přiléhavém modrošedém oděvu sedí na nízké stoličce za nízkým stolkem, v&amp;nbsp;ruce drží psací štětec, na stole má připravený arch papíru a prací potřeby, za zády muže je paraván s&amp;nbsp;šedohnědou malbou draků v&amp;nbsp;oblacích|Čchingský císař [[Kchang-si]] za pracovním stolem, alt=Černobílá perokresba; skupina čtyř ruských poslů ve slavnostních zdobených hávech v&amp;nbsp;centru a vlevo obrazu je přijímána větším počtem mandžuských a čínských hodnostářů stojících po pravé straně a za Rusy, vůdce Rusů v&amp;nbsp;centru vítá mandžuský hodnostář stojící na nízkém stupni schodiště u&amp;nbsp;vstupu do pavilónu na pravém okraji obrazu.|Ruští vyslanci v&amp;nbsp;Číně, ilustrace časopisu ''Niva'' z&amp;nbsp;19. století, alt=mapa okolí Bajkalu a Zabajkalska, vyznačeny ruské ostrohy vzniklé v letech 1647–1688 s daty založení: a sice Věrchněangarsk (1647) u severního konce Bajkalu a Barguzinsk (1648) nedaleko na východ od střední části Bajkalu; Irgensk, Telembinsk a Něrčinsk (1653–1658) uprostřed Zabajkalského kraje; západně od jižního cípu Bajkalu Irkutsk (1661), východně od jižního cípu Bajkalu Udinsk a Selenginsk (1665–1666); jihovýchodně od Barguzinska Jeravninsk (1675), jihozápdně od Irkutska Tunkinsk (1676) mezi Bajkalem a Udinskem Itancinsk, Iljinsk a Kabansk (1679–1688)|Ruská kolonizace západního Zabajkalska od 40. do 80.&amp;nbsp;let 17.&amp;nbsp;století, alt=Mapa Zabajkalska a Poamuří s&amp;nbsp;vyznačenými směry pohybu Čchingů (z&amp;nbsp;Ninguty a Girinu po Sungari a Amuru k&amp;nbsp;Ajgunu a kumarsku a na Zeju, od Nonu k&amp;nbsp;jezeru Dalaj núr) a nájezd Mongolů na Tunkinsk|Čchingská ofenzíva v&amp;nbsp;Poamuří v&amp;nbsp;letech 1683–84 (modře) a mongolský výpad k&amp;nbsp;Tunkinskému ostrohu roku 1684 (zeleně). Ruská opevněná sídla vyznačena červeně, čchingská modře., alt=Mapa Zabajkalska a Poamuří s&amp;nbsp;vyznačenými směry pohybu Čchingů (z&amp;nbsp;Ajgunu po Amuru k&amp;nbsp;Albazinu) a nájezdy Mongolů na ruské ostrohy v&amp;nbsp;Zabajkalí|Čchingská ofenzíva v&amp;nbsp;Poamuří roku 1685 – obležení Albazinu a jeho dobytí (modře), ústup Rusů k&amp;nbsp;Něrčinsku (červeně čárkovaně), návrat Rusů do Albazinu (červeně), příchod Bejtonova oddílu do Něrčinska (červeně čerchovaně) a útoky Mongolů (zeleně)., alt=Černobílá kresba palisádou obehnaného městečka na skalní vyvýšenině u&amp;nbsp;řeky, obklopeného ze tří stran vojenskými oddíly. V&amp;nbsp;pozadí na krajích kresby je les, na řece lodě.|Čchingské vojsko obléhá [[Albazino|Albazin]], ilustrace čínské knihy z&amp;nbsp;konce 17. století, alt=Černobílá rytina malé pevnosti s několika budovami obehnanými obdélníkovými hradbami s baštami uprostřed každé strany. Pevnost je ze tří stran obklopena trojitými valy obléhatelů na čtvrté, spodní straně je řeka, na řece na ostrově opevněný tábor obléhatelů jen o málo menší než pevnost.|Obležení Albazinu čchingským vojskem. {{#tag:ref|Na opevnění Albazinu jsou nápadné [[bastion]]y evropského stylu, se šikmými stěnami, vhodné pro boční palbu, kontrastující s&amp;nbsp;mnohem méně obranyschopnějším opevněním čchingského tábora na spodu rytiny s&amp;nbsp;jeho obdélnými vysunutými branami, charakteristickými pro čínské pevnostní stavitelství.&lt;ref name=\"andrade 177 181 184\"/&gt;|group=pozn.}} Nizozemská rytina z 18. století., alt=Černobílá kresba; dva vojáci ozbrojení dlouhými ručnicemi a sekyrami se šavlemi u&amp;nbsp;pasu se procházející se po břehu řeky, v&amp;nbsp;pozadí na druhém břehu moskevský Kreml.|Vojáci moskevských střeleckých pluků, rok 1674. Ilustrace z&amp;nbsp;''Istoričeskoje opisanije oděždy i vooruženija rossijskich vojsk'' (''Historický popis oděvu a výzbroje ruských vojsk'', 1841–62)., alt=Mapa Zabajkalska a Poamuří s&amp;nbsp;vyznačenými směry pohybu Čchingů (z&amp;nbsp;Ajgunu po Amuru k&amp;nbsp;Albazinu a jeho obležení a zpět, z&amp;nbsp;Číny do Mongolska a zpět); útoky Mongolů – obležení Selenginsku a postup na Udinsk; postup ruského Golovinova pluku ze západu přes Irkutsk do Udinska, část až do Něrčinska|Čchingská ofenzíva v&amp;nbsp;Poamuří v&amp;nbsp;letech 1686–88 (modře, cesta a návrat vyslanců modře čerchovaně) a mongolské útoky (zeleně) a postup Golovinova pluku (červeně; postup menšího oddílu do Něrčinska červeně čerchovaně)., alt=Barevná olejomalba, portrét otylého muže středního věku ve hnědorudém oděvu s&amp;nbsp;širokou modrou šerpou přes prsa a velkou maršálskou hvězdou na hrudi.|[[Fjodor Alexejevič Golovin]], alt=Mapa Zabajkalska a Poamuří s&amp;nbsp;vyznačenými směry pohybu Čchingů (z&amp;nbsp;Ajgunu po Amuru a Šilce k&amp;nbsp;Něrčinsku a od Nonu přes Dalaj núr k&amp;nbsp;Něrčinsku) a Golovinova vojska (od Selenginska k&amp;nbsp;Něrčinsku)|Pohyb čchingského (modře) a ruského (červeně) vojska a vyslanců k&amp;nbsp;Něrčinsku roku 1689, alt=Mapa Zabajkalí a Poamuří, barevně vyznačeno ruské a čchingské území k roku 1688, návrhy stran při jednání v Něrčinsku a hranice podle něrčinského míru|Ruské (růžově) a čchingské (modře) území k počátku roku 1689 a hranice podle Něrčinské smlouvy (černě). Červeně vyznačen ruský návrh hranice na Amuru a světle modře čchingský požadavek hranice u Bajkalu., alt=Barevná kresba střetu dvou armád, vpravo modří a šedí čchingští vojáci, zespoda vzhůru mušketýři, dělostřelci s&amp;nbsp;malými bombardami umístěnými na zemi a za nimi a nad nimi jízda a za ní pěchota. Na levé straně obrazu různobarevné skupiny střelců z&amp;nbsp;mušket, spodní skupina kryjící se a pálící za ležícími koňmi, další v&amp;nbsp;pozadí stojí a klečí na skalách.|Čchingská armáda v&amp;nbsp;bitvě s&amp;nbsp;Džúngary [[Bitva u Ulan Butungu|u&amp;nbsp;Ulan Butungu]] (1690). Ilustrace z&amp;nbsp;čínské knihy čchingského období]</td>\n",
  294. " <td>418.0</td>\n",
  295. " <td>378.0</td>\n",
  296. " <td>17</td>\n",
  297. " <td>1204861</td>\n",
  298. " <td>Rusko-čchingská válka</td>\n",
  299. " <td>19050733</td>\n",
  300. " </tr>\n",
  301. " <tr>\n",
  302. " <th>34</th>\n",
  303. " <td>314.800000</td>\n",
  304. " <td>310.800000</td>\n",
  305. " <td>[alt=Fotografie bíle omítnutého zděného přístavku k vyššímu domu (který je mimo záběr, v čelní stěně pod ozdobnou stříškou dřevěné dveře, po jejich stranách pamětní tabulky, nade dveřmi pod stříškou krátký čínský nápis. Omítka je stará a špinavá, po levé straně u zdi stojí zelená popelnice, ve výši cca tří metrů bezprostředně před přístavkem vede spleť drátů elektrického vedení.|Vchod do Chu Čeng-jenova domu v&amp;nbsp;Siou-ning, alt=Šest otisků čínských pečetí, otisky jsou čtvercové (jeden obdélný), červené na béžovém papíře|Příklady otisků Chu Čeng-jenových pečetí, alt=Čínská malba několika kusů ovoce, vlevo od středu leží tři žluté mandarinky na lehce načrtnuté obdélné kamenné misce, vpravo od centra jedno červené kaki na několikacentimetrovém plátu dřeva z kmene nějakého stromu o průměru cca 20–30 cm.|''[[Kaki]] a tři žluté mandarinky'', ilustrace z&amp;nbsp;''Příručky malířství a kaligrafie Studovny deseti bambusů'', ukázka barevných přechodů v&amp;nbsp;knižní ilustraci dosažených Chu Čeng-jenovými tiskovými metodami., alt=Čínská kaligrafie, nápis v pěti sloupcích černou tuší na vysoký a úzký ozdobný papír, uprostřed papíru kresba květiny, kvůli které je prostřední sloupec textu krátký a sousední sloupce kresbu obtékají.|Dopis Chuova současníka a mingského loajalisty Cou Č’-lina, na dekorativním papíru Studovny deseti bambusů, alt=V horní části obrazu kresba tuší větévky bambusu na bílém pozadí. Od středu dolů tříznakový čínský nápis ukončený otiskem červené pečeti.| ''Zasněžený bambus'', ilustrace z&amp;nbsp;''Příručky malířství a kaligrafie Studovny deseti bambusů'']</td>\n",
  306. " <td>312.0</td>\n",
  307. " <td>312.0</td>\n",
  308. " <td>5</td>\n",
  309. " <td>1141550</td>\n",
  310. " <td>Chu Čeng-jen</td>\n",
  311. " <td>20095575</td>\n",
  312. " </tr>\n",
  313. " <tr>\n",
  314. " <th>184</th>\n",
  315. " <td>311.333333</td>\n",
  316. " <td>307.166667</td>\n",
  317. " <td>[alt=Barevná fotografie noční oblohy: dole obzor zapadajícího slunce s končícími červánky a nad nimi se táhnoucí slabou vrstvou mraků na jinak bezoblačné obloze. Na tmavě modré obloze plné hvězd vyznačeno souhvězdí Persea prostřednictvím spojení jeho hvězd bílými čarami: od vrchní hvězdy vede čára dolů mírně doprava, na druhé hvězdě se větví a jedna větev pokračuje mírně klikatě stejným směrem přes dalších šest hvězd, přičemž na páté se ohýbá nahoru a tvoří jakýsi ocásek; druhá větev se stáčí doprava téměř do horizontální pozice postupně klesající dolů přes další tři hvězdy|Souhvězdí Persea viditelné pouhým okem, α&amp;nbsp;Persei a otevřená hvězdokupa Melotte 20 na amatérském snímku, alt=na obrázku malý výřez temné noční oblohy hustě poseté hvězdami, které tvoří dvě vedle sebe ležící hvězdokupy, z nichž ta vpravo je o trochu více zhuštěná|Dvojitá hvězdokupa (NGC 869 a NGC 884), Mlhovina M76 na snímku z&amp;nbsp;dalekohledu o&amp;nbsp;průměru 2&amp;nbsp;m., Galaxie NGC 1275 na fotografii z&amp;nbsp;Hubbleova vesmírného dalekohledu, alt=Barevná malba: výtvarně vyvedený Perseus jako voják ležící ve hvězdném poli, jehož rozložení těla kopíruje rozložení hvězd souhvězdí na nebi. Perseus s růžovou pletí má modrou přilbu se zlatými ozdobami a nad sebou zdvižený ocelový meč se zlatou rukojetí. Na sobě má zlaté brnění a růžovou tuniku, na nohou růžové sandály s andělskými křidélky na patách. V bleděmodré obloze leží s nakročenýma nohama a s hlavou medúzy, kterou drží levou rukou u svého boku. Hvězdy jsou vyvedeny v podobě několika pěticípých a většinou větších šesticípých hvězdiček, Souhvězdí Persea je odděleno od ostatních slabou čárou okolo něho, okolní souhvězdí jsou popsána bez naznačení pouze latinskými názvy a nad mapou je nadpis s anglicky psaným názvem obrazu „Perseus a hlava medúzy“|Souhvězdí Persea s hlavou Gorgony Medúzy ve hvězdném atlasu Urania Minor z roku 1825]</td>\n",
  318. " <td>133.0</td>\n",
  319. " <td>130.5</td>\n",
  320. " <td>6</td>\n",
  321. " <td>43249</td>\n",
  322. " <td>Souhvězdí Persea</td>\n",
  323. " <td>20193119</td>\n",
  324. " </tr>\n",
  325. " </tbody>\n",
  326. "</table>\n",
  327. "</div>"
  328. ],
  329. "text/plain": [
  330. " avg_caption_len avg_clean_caption_len \\\n",
  331. "75 476.000000 467.250000 \n",
  332. "233 453.615385 439.384615 \n",
  333. "145 424.705882 404.705882 \n",
  334. "34 314.800000 310.800000 \n",
  335. "184 311.333333 307.166667 \n",
  336. "\n",
  337. " captions \\\n",
  338. "75 [V&nbsp;řase ''[[Chlamydomonas]]'' byla poprvé dokázána přítomnost plastidové DNA<br />(zvětšení: 10&nbsp;000×, [[rastrovací elektronový mikroskop]]), Obecné schéma chloroplastové DNA: [[small single copy|SSC]] (small single copy), dva regiony [[Palindrom (genetika)|inverted repeats]]&nbsp;a [[large single copy|LSC]] (large single copy), 1.3|[[Ribozom]] v&nbsp;chloroplastech slouží k&nbsp;[[translace (biologie)|translaci]] RNA, která vznikla [[Transkripce (DNA)|přepisem]] pDNA, Na tomto [[fylogenetický strom|fylogenetickém stromu]] [[eukaryota|eukaryot]] je zachycena jedna z&nbsp;představ, jak vznikaly [[plastid]]y. Modrá šipka od bakterií ke skupině ''[[rostliny|Archaeplastida]]'' znázorňuje primární endosymbiózu, zbylé dva červené proužky znázorňují endosymbiózu sekundární<br />(představa o&nbsp;vzniku plastidů dle<ref>{{Citace periodika | doi = 15306349| issn = 0962-8452| ročník = 271| číslo = 1545| strany = 1251–62| autor= Cavalier-Smith, Thomas| titul = Only six kingdoms of life| periodikum = Proceedings. Biological Sciences / The Royal Society| rok = 2004| url = http://www.ncbi.nlm.nih.gov/pubmed/15306349 |jazyk=anglicky}}</ref>, aktualizace systému dle<ref name=\"adl\">{{citace periodika | autor = Adl, Sina M., et al | titul = The New Higher Level Classification of Eukaryotes with Emphasis on the Taxonomy of Protists | periodikum = Journal of Eukaryotic Microbiology | rok = 2005 | ročník = 52 | číslo = 5 | strany = 399–451 | url = http://www.blackwell-synergy.com/doi/abs/10.1111/j.1550-7408.2005.00053.x | jazyk = anglicky | příjmení = | jméno = | datum přístupu = 2009-03-14 | url archivu = https://web.archive.org/web/20170914143519/http://www.blackwell-synergy.com/doi/abs/10.1111/j.1550-7408.2005.00053.x | datum archivace = 2017-09-14 | nedostupné = ano }} {{Wayback|url=http://www.blackwell-synergy.com/doi/abs/10.1111/j.1550-7408.2005.00053.x |date=20170914143519 }}</ref>)] \n",
  339. "233 [alt=Malba muže středního věku od pasu nahoru, s&nbsp;knírkem a malou úzkou špičatou bradkou, na hlavě má přiléhavou černou čapku s&nbsp;výraznýma ušima po stranách, oblečen je v&nbsp;přiléhavý světlý oděv ke krku|Portrét tchangského císaře [[Süan-cung]]a (vládl 712–756), alt=Mapa Číny v&nbsp;hranicích kolem roku 745 (to jest vlastní Čína spolu s&nbsp;dnešní provincií Kan-su a dnešní autonomní oblastí Sin-ťiang až k&nbsp;Balchašskému jezeru), vyznačena jsou hlavní města Čchang-an a Luo-jang a obvody, sídla a počet vojáků deseti pohraničních velitelství na severní, západní a jihozápadní hranici|náhled|upright=2.5|Pohraniční vojenské oblasti v&nbsp;říši Tchang, kolem roku 745. Uvedeny početnost vojsk, název a sídlo oblasti., alt=Mapa severovýchodní Číny, první ze série map dokumentujících průběh povstání: oblasti ovládané povstalci jsou červeně podbarveny, červené a žluté šipky značí pohyby vojsk, významná města jsou obarvena podle toho, kdo je drží, uvedena jsou jména generálů a místa bitev. Na této mapě jsou červeně obarveny oblasti Jing-čou, Fan-jangu a Luo-jangu, červené šipky značí postup povstalců na jih, žluté šipky tchangské protiútoky v&nbsp;Che-peji a stahování vládních jednotek ze severozápadního pohraničí.|Prosinec 755 – leden 756: počáteční tažení povstalců, dobytí [[Kchaj-feng|Pien-čou]] a [[Luo-jang]]u. Tchangský protiútok v&nbsp;Che-peji., alt=Černobílá kresba staršího muže s&nbsp;dlouhým knírem a bradkou v&nbsp;bohatě zřaseném rouchu s&nbsp;širokými rukávy|Generál [[Kuo C’-i]], ilustrace z&nbsp;knihy<!-- 晩笑堂竹荘畫傳 --> z&nbsp;20. let 20. století, alt=Mapa severovýchodní Číny, druhá ze série map dokumentujících průběh povstání. Červeně je nyní obarven západní Che-pej, takže povstalci drží souvislé území, červené šipky míří mnoha směry, ale jsou odraženy, žluté šipky značí tchangské jednotky poslané na pomoc obléhanému Nan-jangu / Teng-čou na jihu.|Leden – únor 756: neúspěšné pokusy povstalců o&nbsp;rozšíření území na jihu a východě, dobytí Cheng-čou na severu a tím obnovení spojení Fan-jangu s&nbsp;Luo-jangem, alt=Mapa severovýchodní Číny, třetí ze série map dokumentujících průběh povstání. Odbarven byl západní Che-pej, takže oblast Fan-Jangu je opět rozpojena od Luo-jangu, Jing-čou přešlo na druhou stranu, takže je také odbarveno, řada šipek obou barev značí boje v&nbsp;západním Che-peji.|Březen – červenec 756: tchangský protiútok v&nbsp;Che-peji, stabilizace fronty na jihu, alt=Mapa severovýchodní Číny, čtvrtá ze série map dokumentujících průběh povstání. Červeně je obarveno souvislé území od Fan-Jangu až po Čchang-an, červené šipky jsou na jihu odraženy, žlutě přerušovaně je vyznačen ústup císaře na jihozápad do I-čou a jeho syna na severozápad do Ling-wu. Navíc je na této mapě uvedena výměna tchangských i&nbsp;jenských císařů a na dolním okraji zelené šipky postupu Li Lina podél řeky Jang-c’-ťiang na východ k&nbsp;Jang-čou.|Červenec 756 – listopad 757: Povstalci dobývají Čchang-an, Tchangové ustupují na jiho- a severozápad. Neúspěšné tchangské pokusy o&nbsp;znovudobytí Čchang-anu, neúspěchy povstalců při snaze o&nbsp;postup na jih a východ. Povstání Li Lina na jihu., alt=Malba řady jezdců na hedvábném svitku, kolona se vine hornatým terénem, první jezdci dojeli k&nbsp;mostku, který je umístěn dole uprostřed|''Putování císaře [[Süan-cung|Ming-chuanga]]{{#tag:ref|Ming-chuang je posmrtné jméno císaře [[Süan-cung]]a (vládl 712–756).|group=pozn.}} do S’-čchuanu'', pozdně mingská kopie díla [[Čchiou Jing]]a (1494–1552), alt=Mapa severovýchodní Číny, pátá ze série map dokumentujících průběh povstání. Červeně je obarven již jen Luo-jang a okolí Siang-čou, červené šipky značí ústup povstalců, žluté šipky postup vládních sil na východ, nejdříve čerchovaně pro cestu ujgurských posil, od Ling-wu přes Čchang-an již plnou čarou. Fan-jang je fialový a fialová šipka na jih k&nbsp;Siang-čou značí útok Š’ S’-minga.|Listopad 757 – duben 759: Tchangové dobývají Čchang-an a Luo-jang (757), povstalci An Čching-süa obleženi v&nbsp;jižním Che-peji (758), povstalci v&nbsp;severním Che-peji (Š’ S’-ming) přecházejí na tchangskou stranu. Na jaře 759 úspěšný útok Š’ S’-minga proti Tchangům i&nbsp;An Čching-süovi., alt=Fotografie malé keramické figurky muže na koni, kůň je hnědý se světlou hřívou, jezdec oblečený v&nbsp;hnědý oděv se žlutými tečkami, má u&nbsp;pasu meč, je otočený doleva a střílí z&nbsp;(chybějícího) luku vzhůru|Tchangská keramická figurka střílejícího jízdního lučištníka, alt=Mapa severovýchodní Číny, šestá ze série map dokumentujících průběh povstání. Červeně je opět obarveno souvislé území od Fan-Jangu po Luo-jang, červené šipky značí postup Š’ S’-minga přes Pien-čou na Luo-jang, krátká žlutá taktický přesun Li Kuang-piho na protější břeh Žluté řeky. Navíc je na této mapě uvedena druhá výměna tchangských i&nbsp;jenských císařů a na dolním okraji zeleně šestero povstání podél řeky Jang-c’-ťiang.|Duben 759 – říjen 762: Š’ S’-ming dobývá Luo-jang (759) a odráží Tchangy (761). Výměna císařů u&nbsp;povstalců (duben 761) a Tchangů (květen 762). Zeleně protitchangská povstání na jihu., alt=Mapa severovýchodní Číny, sedmá ze série map dokumentujících průběh povstání. Červeně je vyznačen již jen Luo-jang, k&nbsp;němu se ze tří směrů sbíhají žluté šipky, jediná červená čárkovaná čára se od něj klikatí k&nbsp;severní hranici, podél její cesty je fialově uvedeno půl tuctu jmen|Říjen 762 – leden 763: Tchangové dobývají Luo-jang, ústup a útěk Š’ Čchao-iho na sever a jeho smrt na severní hranici. Povstalečtí generálové (fialově) přecházejí na tchangskou stranu., alt=Mapa Číny k&nbsp;roku 763, vyznačeno je na několik desítek správních obvodů, každý se svým názvem, pět obvodů na severovýchodě země má název vyveden červeně|[[Říše Tchang|Tchangská Čína]] k&nbsp;roku 763, rozdělení na správní obvody guvernérů ''[[ťie-tu-š’]]''. Území ''ťie-tu-š’'' potvrzených z&nbsp;bývalých povstaleckých generálů vyznačena červenou kurzívou.] \n",
  340. "145 [alt=Mapa Zabajkalska a Poamuří s uvedenými jmény kmenů a státních celků necházejících se v regionu. A sice Burjati a Evenkové v Zabajkalí, Dauři, Gogulové, Ďučeři, Natci a Giljaci od horního k dolnímu toku Amuru a Evenkové severně od Amuru. Ze států jsou uvedeny říše Čching (v jižním Mandžusku), Mongolský chanát (východní Mongolsko) a Korea (její severovýchodní cíp).|Kmeny Poamuří a Zabajkalska v polovině 17. století, alt=Barevná současná fotografie; v&nbsp;centru a vpravo palisáda dvojnásobné výše člověka uprostřed s&nbsp;dřevěnou patrovou věží s&nbsp;věžičkou. Na pozadí vlevo přízemní dřevěné domky.|Ukázka opevnění ruských ostrohů v&nbsp;17.&nbsp;století. Jižní stěna [[Ilimsk|ilimského ostrohu]] s&nbsp;věží z&nbsp;roku 1667, přemístěná do muzea [[Talcy (muzeum)|Talcy]] u&nbsp;[[Irkutsk]]a., alt=Mapa Zabajkalska a Poamuří s&nbsp;vyznačenými směry pohybu Rusů (ze severu do Zabajkalí a k&nbsp;Amuru, podél Amuru, od ústí Amuru po moři na sever), Čchingů (z&nbsp;Ninguty a Girinu po Sungari na sever k&nbsp;Amuru) a amurských kmenů (od Amuru na jih k&nbsp;řekám Non a Sungari)|Akce Rusů (červeně), Čchingů (modře) a pohyb amurských kmenů na jih (zeleně) v&nbsp;Zabajkalsku a&nbsp;Poamuří v&nbsp;letech 1652–1658, alt=Mapa Zabajkalska a Poamuří s černě vyznačenými ruskými sídly založenými do 60. let 17. století (Barguzinsk u Bajkalu, Irgensk, Telembinsk a Něrčinsk ve východním Zabajkalsku) a červeně vyznačenými ruskými sídly vzniklými v letech 1665–1681 (Jeravninsk v Zabajkalsku roku 1675), na horním Amuru Albazin (1665), na Zeje Verchnozejsk, Selemdžinsk a Dolonsk (1679–1681) a na severovýchodě u Ochotského moře Udsk (1679).|Ruská kolonizace Poamuří a východního Zabajkalska od 60. do počátku 80. let 17. století., alt=Barevná malba z přelomu 17. a 18. století; mladý muž v&nbsp;přiléhavém modrošedém oděvu sedí na nízké stoličce za nízkým stolkem, v&nbsp;ruce drží psací štětec, na stole má připravený arch papíru a prací potřeby, za zády muže je paraván s&nbsp;šedohnědou malbou draků v&nbsp;oblacích|Čchingský císař [[Kchang-si]] za pracovním stolem, alt=Černobílá perokresba; skupina čtyř ruských poslů ve slavnostních zdobených hávech v&nbsp;centru a vlevo obrazu je přijímána větším počtem mandžuských a čínských hodnostářů stojících po pravé straně a za Rusy, vůdce Rusů v&nbsp;centru vítá mandžuský hodnostář stojící na nízkém stupni schodiště u&nbsp;vstupu do pavilónu na pravém okraji obrazu.|Ruští vyslanci v&nbsp;Číně, ilustrace časopisu ''Niva'' z&nbsp;19. století, alt=mapa okolí Bajkalu a Zabajkalska, vyznačeny ruské ostrohy vzniklé v letech 1647–1688 s daty založení: a sice Věrchněangarsk (1647) u severního konce Bajkalu a Barguzinsk (1648) nedaleko na východ od střední části Bajkalu; Irgensk, Telembinsk a Něrčinsk (1653–1658) uprostřed Zabajkalského kraje; západně od jižního cípu Bajkalu Irkutsk (1661), východně od jižního cípu Bajkalu Udinsk a Selenginsk (1665–1666); jihovýchodně od Barguzinska Jeravninsk (1675), jihozápdně od Irkutska Tunkinsk (1676) mezi Bajkalem a Udinskem Itancinsk, Iljinsk a Kabansk (1679–1688)|Ruská kolonizace západního Zabajkalska od 40. do 80.&nbsp;let 17.&nbsp;století, alt=Mapa Zabajkalska a Poamuří s&nbsp;vyznačenými směry pohybu Čchingů (z&nbsp;Ninguty a Girinu po Sungari a Amuru k&nbsp;Ajgunu a kumarsku a na Zeju, od Nonu k&nbsp;jezeru Dalaj núr) a nájezd Mongolů na Tunkinsk|Čchingská ofenzíva v&nbsp;Poamuří v&nbsp;letech 1683–84 (modře) a mongolský výpad k&nbsp;Tunkinskému ostrohu roku 1684 (zeleně). Ruská opevněná sídla vyznačena červeně, čchingská modře., alt=Mapa Zabajkalska a Poamuří s&nbsp;vyznačenými směry pohybu Čchingů (z&nbsp;Ajgunu po Amuru k&nbsp;Albazinu) a nájezdy Mongolů na ruské ostrohy v&nbsp;Zabajkalí|Čchingská ofenzíva v&nbsp;Poamuří roku 1685 – obležení Albazinu a jeho dobytí (modře), ústup Rusů k&nbsp;Něrčinsku (červeně čárkovaně), návrat Rusů do Albazinu (červeně), příchod Bejtonova oddílu do Něrčinska (červeně čerchovaně) a útoky Mongolů (zeleně)., alt=Černobílá kresba palisádou obehnaného městečka na skalní vyvýšenině u&nbsp;řeky, obklopeného ze tří stran vojenskými oddíly. V&nbsp;pozadí na krajích kresby je les, na řece lodě.|Čchingské vojsko obléhá [[Albazino|Albazin]], ilustrace čínské knihy z&nbsp;konce 17. století, alt=Černobílá rytina malé pevnosti s několika budovami obehnanými obdélníkovými hradbami s baštami uprostřed každé strany. Pevnost je ze tří stran obklopena trojitými valy obléhatelů na čtvrté, spodní straně je řeka, na řece na ostrově opevněný tábor obléhatelů jen o málo menší než pevnost.|Obležení Albazinu čchingským vojskem. {{#tag:ref|Na opevnění Albazinu jsou nápadné [[bastion]]y evropského stylu, se šikmými stěnami, vhodné pro boční palbu, kontrastující s&nbsp;mnohem méně obranyschopnějším opevněním čchingského tábora na spodu rytiny s&nbsp;jeho obdélnými vysunutými branami, charakteristickými pro čínské pevnostní stavitelství.<ref name=\"andrade 177 181 184\"/>|group=pozn.}} Nizozemská rytina z 18. století., alt=Černobílá kresba; dva vojáci ozbrojení dlouhými ručnicemi a sekyrami se šavlemi u&nbsp;pasu se procházející se po břehu řeky, v&nbsp;pozadí na druhém břehu moskevský Kreml.|Vojáci moskevských střeleckých pluků, rok 1674. Ilustrace z&nbsp;''Istoričeskoje opisanije oděždy i vooruženija rossijskich vojsk'' (''Historický popis oděvu a výzbroje ruských vojsk'', 1841–62)., alt=Mapa Zabajkalska a Poamuří s&nbsp;vyznačenými směry pohybu Čchingů (z&nbsp;Ajgunu po Amuru k&nbsp;Albazinu a jeho obležení a zpět, z&nbsp;Číny do Mongolska a zpět); útoky Mongolů – obležení Selenginsku a postup na Udinsk; postup ruského Golovinova pluku ze západu přes Irkutsk do Udinska, část až do Něrčinska|Čchingská ofenzíva v&nbsp;Poamuří v&nbsp;letech 1686–88 (modře, cesta a návrat vyslanců modře čerchovaně) a mongolské útoky (zeleně) a postup Golovinova pluku (červeně; postup menšího oddílu do Něrčinska červeně čerchovaně)., alt=Barevná olejomalba, portrét otylého muže středního věku ve hnědorudém oděvu s&nbsp;širokou modrou šerpou přes prsa a velkou maršálskou hvězdou na hrudi.|[[Fjodor Alexejevič Golovin]], alt=Mapa Zabajkalska a Poamuří s&nbsp;vyznačenými směry pohybu Čchingů (z&nbsp;Ajgunu po Amuru a Šilce k&nbsp;Něrčinsku a od Nonu přes Dalaj núr k&nbsp;Něrčinsku) a Golovinova vojska (od Selenginska k&nbsp;Něrčinsku)|Pohyb čchingského (modře) a ruského (červeně) vojska a vyslanců k&nbsp;Něrčinsku roku 1689, alt=Mapa Zabajkalí a Poamuří, barevně vyznačeno ruské a čchingské území k roku 1688, návrhy stran při jednání v Něrčinsku a hranice podle něrčinského míru|Ruské (růžově) a čchingské (modře) území k počátku roku 1689 a hranice podle Něrčinské smlouvy (černě). Červeně vyznačen ruský návrh hranice na Amuru a světle modře čchingský požadavek hranice u Bajkalu., alt=Barevná kresba střetu dvou armád, vpravo modří a šedí čchingští vojáci, zespoda vzhůru mušketýři, dělostřelci s&nbsp;malými bombardami umístěnými na zemi a za nimi a nad nimi jízda a za ní pěchota. Na levé straně obrazu různobarevné skupiny střelců z&nbsp;mušket, spodní skupina kryjící se a pálící za ležícími koňmi, další v&nbsp;pozadí stojí a klečí na skalách.|Čchingská armáda v&nbsp;bitvě s&nbsp;Džúngary [[Bitva u Ulan Butungu|u&nbsp;Ulan Butungu]] (1690). Ilustrace z&nbsp;čínské knihy čchingského období] \n",
  341. "34 [alt=Fotografie bíle omítnutého zděného přístavku k vyššímu domu (který je mimo záběr, v čelní stěně pod ozdobnou stříškou dřevěné dveře, po jejich stranách pamětní tabulky, nade dveřmi pod stříškou krátký čínský nápis. Omítka je stará a špinavá, po levé straně u zdi stojí zelená popelnice, ve výši cca tří metrů bezprostředně před přístavkem vede spleť drátů elektrického vedení.|Vchod do Chu Čeng-jenova domu v&nbsp;Siou-ning, alt=Šest otisků čínských pečetí, otisky jsou čtvercové (jeden obdélný), červené na béžovém papíře|Příklady otisků Chu Čeng-jenových pečetí, alt=Čínská malba několika kusů ovoce, vlevo od středu leží tři žluté mandarinky na lehce načrtnuté obdélné kamenné misce, vpravo od centra jedno červené kaki na několikacentimetrovém plátu dřeva z kmene nějakého stromu o průměru cca 20–30 cm.|''[[Kaki]] a tři žluté mandarinky'', ilustrace z&nbsp;''Příručky malířství a kaligrafie Studovny deseti bambusů'', ukázka barevných přechodů v&nbsp;knižní ilustraci dosažených Chu Čeng-jenovými tiskovými metodami., alt=Čínská kaligrafie, nápis v pěti sloupcích černou tuší na vysoký a úzký ozdobný papír, uprostřed papíru kresba květiny, kvůli které je prostřední sloupec textu krátký a sousední sloupce kresbu obtékají.|Dopis Chuova současníka a mingského loajalisty Cou Č’-lina, na dekorativním papíru Studovny deseti bambusů, alt=V horní části obrazu kresba tuší větévky bambusu na bílém pozadí. Od středu dolů tříznakový čínský nápis ukončený otiskem červené pečeti.| ''Zasněžený bambus'', ilustrace z&nbsp;''Příručky malířství a kaligrafie Studovny deseti bambusů''] \n",
  342. "184 [alt=Barevná fotografie noční oblohy: dole obzor zapadajícího slunce s končícími červánky a nad nimi se táhnoucí slabou vrstvou mraků na jinak bezoblačné obloze. Na tmavě modré obloze plné hvězd vyznačeno souhvězdí Persea prostřednictvím spojení jeho hvězd bílými čarami: od vrchní hvězdy vede čára dolů mírně doprava, na druhé hvězdě se větví a jedna větev pokračuje mírně klikatě stejným směrem přes dalších šest hvězd, přičemž na páté se ohýbá nahoru a tvoří jakýsi ocásek; druhá větev se stáčí doprava téměř do horizontální pozice postupně klesající dolů přes další tři hvězdy|Souhvězdí Persea viditelné pouhým okem, α&nbsp;Persei a otevřená hvězdokupa Melotte 20 na amatérském snímku, alt=na obrázku malý výřez temné noční oblohy hustě poseté hvězdami, které tvoří dvě vedle sebe ležící hvězdokupy, z nichž ta vpravo je o trochu více zhuštěná|Dvojitá hvězdokupa (NGC 869 a NGC 884), Mlhovina M76 na snímku z&nbsp;dalekohledu o&nbsp;průměru 2&nbsp;m., Galaxie NGC 1275 na fotografii z&nbsp;Hubbleova vesmírného dalekohledu, alt=Barevná malba: výtvarně vyvedený Perseus jako voják ležící ve hvězdném poli, jehož rozložení těla kopíruje rozložení hvězd souhvězdí na nebi. Perseus s růžovou pletí má modrou přilbu se zlatými ozdobami a nad sebou zdvižený ocelový meč se zlatou rukojetí. Na sobě má zlaté brnění a růžovou tuniku, na nohou růžové sandály s andělskými křidélky na patách. V bleděmodré obloze leží s nakročenýma nohama a s hlavou medúzy, kterou drží levou rukou u svého boku. Hvězdy jsou vyvedeny v podobě několika pěticípých a většinou větších šesticípých hvězdiček, Souhvězdí Persea je odděleno od ostatních slabou čárou okolo něho, okolní souhvězdí jsou popsána bez naznačení pouze latinskými názvy a nad mapou je nadpis s anglicky psaným názvem obrazu „Perseus a hlava medúzy“|Souhvězdí Persea s hlavou Gorgony Medúzy ve hvězdném atlasu Urania Minor z roku 1825] \n",
  343. "\n",
  344. " median_caption_len median_clean_caption_len num_captions page_id \\\n",
  345. "75 167.5 160.0 4 407355 \n",
  346. "233 458.0 438.0 13 1332471 \n",
  347. "145 418.0 378.0 17 1204861 \n",
  348. "34 312.0 312.0 5 1141550 \n",
  349. "184 133.0 130.5 6 43249 \n",
  350. "\n",
  351. " page_title revision_id \n",
  352. "75 Plastidová DNA 20161831 \n",
  353. "233 Povstání An Lu-šana 19552527 \n",
  354. "145 Rusko-čchingská válka 19050733 \n",
  355. "34 Chu Čeng-jen 20095575 \n",
  356. "184 Souhvězdí Persea 20193119 "
  357. ]
  358. },
  359. "execution_count": 38,
  360. "metadata": {},
  361. "output_type": "execute_result"
  362. }
  363. ],
  364. "source": [
  365. "df.sort_values(by='avg_clean_caption_len', ascending=False).head(5)"
  366. ]
  367. },
  368. {
  369. "cell_type": "code",
  370. "execution_count": 39,
  371. "id": "f12329f1",
  372. "metadata": {
  373. "tags": []
  374. },
  375. "outputs": [
  376. {
  377. "data": {
  378. "text/markdown": [
  379. "\n",
  380. "## Average caption lengths at Czech Wikipedia\n",
  381. "\n",
  382. "* Before cleaning: 102.77\n",
  383. "* `&nbsp;` to a space: 99.08\n",
  384. "\n",
  385. "## Median caption lengths at Czech Wikipedia\n",
  386. "\n",
  387. "* Before cleaning: 69.0\n",
  388. "* `&nbsp;` to a space: 65.5\n"
  389. ],
  390. "text/plain": [
  391. "<IPython.core.display.Markdown object>"
  392. ]
  393. },
  394. "metadata": {},
  395. "output_type": "display_data"
  396. }
  397. ],
  398. "source": [
  399. "display(Markdown('''\n",
  400. "## Average caption lengths at Czech Wikipedia\n",
  401. "\n",
  402. "* Before cleaning: {avg_before_cleaning}\n",
  403. "* `&nbsp;` to a space: {avg_no_nbsp}\n",
  404. "\n",
  405. "## Median caption lengths at Czech Wikipedia\n",
  406. "\n",
  407. "* Before cleaning: {median_before_cleaning}\n",
  408. "* `&nbsp;` to a space: {median_no_nbsp}\n",
  409. "'''.format(\n",
  410. " avg_before_cleaning=np.round(df.avg_caption_len.mean(), 2),\n",
  411. " avg_no_nbsp=np.round(df.avg_clean_caption_len.mean(), 2),\n",
  412. " median_before_cleaning=np.round(df.median_caption_len.median(), 2),\n",
  413. " median_no_nbsp=np.round(df.median_clean_caption_len.median(), 2)\n",
  414. ")))"
  415. ]
  416. }
  417. ],
  418. "metadata": {
  419. "kernelspec": {
  420. "display_name": "Python 3",
  421. "language": "python",
  422. "name": "python3"
  423. },
  424. "language_info": {
  425. "codemirror_mode": {
  426. "name": "ipython",
  427. "version": 3
  428. },
  429. "file_extension": ".py",
  430. "mimetype": "text/x-python",
  431. "name": "python",
  432. "nbconvert_exporter": "python",
  433. "pygments_lexer": "ipython3",
  434. "version": "3.7.6"
  435. }
  436. },
  437. "nbformat": 4,
  438. "nbformat_minor": 5
  439. }
  440.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement