Tema: Re: kompas skystyje, pora klausimu
Autorius: krx
Data: 2009-09-23 22:00:24
"Laimis" <wiela@centras.lt> wrote in message 
news:h9cvk9$5c4$1@trimpas.omnitel.net...
> krx rašė:
>>> Na, aš tikiu, kad google'o mokslininkai mokėjo įvertinti, kas yra
>>> high, kas low I/O, juoba teisingai skaičiuoti koreliaciją tiriant virš
>>> 100k hdd populiaciją...
>>
>> Jie tyrė savo problemas, kurios kardanaliai skiriasi nuo vartotojo.
>
> Jie tyrė hdd problemas... ;-)

As is common in server-class deployments, the disks
were powered on, spinning, and generally in service for
essentially all of their recorded life. They were deployed
in rack-mounted servers and housed in professionally-
managed datacenter facilities.

>>> Kita vertus, aš teigiu/tikiu, kad google'o hdd naudojimo scenarijaus
>>> duomenys/statistika yra daugiau nei pakankama, tokia į kurią galima
>>> atsiremti tiek pisiuko naudotojui
>>
>> Manau, kad ne.
>
> AFR yra kur kas realesnis, nei gamintojo deklaruojamas.

Aš niekur gi to nebandau paneigti. Tiesiog skirsis įprasto vartotojo ir 
serveryje naudojamo HDD AFR'as.

>  AFR ir patikimumas po (pirmųjų) aptiktų klaidų.

Na bet tai ir jūrų arkliukui aišku. Kita vertus - turiu eilę HDD, kuriuose 
yra privaryta krūva remapintų sektorių (realiai, ne softiškai), o jie po 
šiai dienai gyvi,sveiki, nors po prisirankiojimo pradirbo jau antra ar 
trečia tiek. Tiesa visi yra enterpise SCSI/SAS/SATA.

> AFR priklausomybė nuo temperatūros paneigianti mitą, kad HDD reikia 
> laikyti kaip galima vėsesnį ir taip bus bemaž dvigubai prailgintas jo 
> gyvenimas....

        Tai čia tas mitas egzistuoja pas tuos, kurie mėgsta hiperbolizuot. 
Bent jau aš tą mitą visada užskaičiau sekančiai: aukštos t-ros pašalinimas 
(virš +45..50C) tiesiog sumažina ankstyvos ir vėlyvos mirties riziką. 
Gyvenimo neilgina, bet padeda jo nesutrumpint.
        Beje, nepritaikius jokio sprendimo labai lengva į tokią temperatūrą 
patekti. Tą rodo ne vienas ir ne du HDD su airflow tempratūros skaitikliu 
išlipusiu virš gamintojo leistino limito. Šiaip tai peraušinti HDD, netgi 
tiek, kiek pas gūglus parodyta kaip "fail", yra ganėtinai sudėtingas 
reikalas ir tam reikia įdėti Darwino prizo vertų pastangų...

> Jie rožiniai bet kokiu atveju, nes nerealūs, neadekvatūs realaus naudojimo 
> scenarijams. Iki šiolei tekdavo matyti tik pavienius didesnių kontorų 
> paskaičiavimus ant pirštų, kad AFR realiomis sąlygomis viršija kelis 
> procentus ir gerokai nesutampa su gamintojo deklaruojamomis vertėmis, 
> tačiau iki tokio tyrimo/statistikos, kurią pateikė pateikė google'as buvo 
> labai labai toli.

Tiesą pasakius, jei pas tave ūkyje bent keliolika-keliasdešimt diskų, tai 
visas tas išvadas turėjai pasidaryti vien iš praktikos, net ir be mokslinės 
analizės. Kada AFR'ai nieko nesako - tai labai paprasta, nes niekas neverčia 
gamintojų deklaruoti tikslius AFR. Teoriškai tokios akcijos kaip 
storagereview ir pan. galėtų daugiau pasakyt apie patikimumą, tik reikėtų 
vartotojui sutikti su instaliuotu servisu 24x7 ir pumpavimu į tinklą, bei 
post-mortem formos užpildymu...

O gūglai bailiai, kad giliau nepaanalizavo imant gamintojus ;-)

>> Temperatūra nėra FIKSUOTAS dydis [*_pysiuko_*] vartotojo atveju. Nes
>> vartotojo kompas negyvena serverinėje su pastoviu oro srautu, kuris
>
> Na, krx, juk pats supranti, kad paskaičiuoti vidurkį nėra problema...

Vidurkis nieko nesako apie dinamiką. O judančias sistemas valgo dinamika.

> Ir turbūt supranti kas yra koreliacija su 95% pasikliautinio intervalo 
> reikšmingumo lygiu ir ką tai reiškia, kai tas pasikliautinis intervalas su 
> tokiu reikšmingumo lygiu yra labai siauras?

Taip, be abejo. Aš tik kvestioonuoju googlo rezultatus man, kada esu 
paprastas mirtingasis. Jų apibrėžtomis sąlygomis atliktas tyrimas puikus, ir 
realiai tos visos išvados ganėtinai tikėtinos ir logiškos.

>> O kaip manote, kodėl nebuvo? Ogi todėl, ka gūgloje HDD sukosi 24x7, ir
>> nustebčiau, jei pas juos HDD turėtų start/stop didesnį nei 10-20-50 
>> eilės.
>
> Aš noriu pasakyti (teigiu), kad minimalus 30000-50000+ start/stop ciklų 
> skaičius nepasiekiamas net ir namuose drožiant pisiukus/laptop'us, tad jo 
> įtaka į hdd pabyrėjimą yra gerokai mažesnė, nei kitų faktorių. Beje,

Nu fck, nesikeikus. Pats rašai, kad HDD gamintojų AFR'as - rožinis ir su 
ragais. O dabar pats tiki, kad tie jų deklaruojami ciklai - realūs. Na ne 
pro kur. Nes pajamtum 3-4 didžiausių gamintojų duomenų lapus - visų jų 
esminiai skaičiai yra VIENODI, arba mažai skiriasi.

> google'as dalinai tyrė iš šį atvejį (matyt iš 100000+ populiacijos buvo 
> statistiškai pakankamai ir tokių, kurie buvo dažnai/dažniau junginėjami ir 
> darbiniams (iki 2 m.) koreliacijos neįžvelgė; tik senesniems už 3 m 
> absoliutus AFR dėl didesnio *power* ciklų skaičiaus pakyla net 2%, tačiau 
> jie patys abejoja, ir mano, kad  tai yra dėl populiacijos mikso 
> specifikos, o ne dėl didesnio susidėvėjimo.

Na bet bjauru pasakyt diskusijoje B, bet nepasakyt A. Jei jau cituoti - tai 
jie ir sako, kad serverių klasės diegime jie NEJAUČIA šito efekto.

>> Reikėtų paklausti o.hardware autorių dviejų - hdd.exe ir terminator?
>
> Aš teigčiau (iš savo patirties), kad paprastai laptop'ų diskai pabyra arba 
> tiesiog pakeičiami, nepasiekę net trečdalio minimalaus (iki 10k). Panašiai 
> ir (kontoriniai) pisiukai, nes toks start/stop tolygus
> bene 4-5 metams darbo...

Nešiojamų kompiuterių diskai pabyra dėl visiškai kitokių priežasčių, nei 
start-stop ciklai. O kontoroje daug kas dar priklauso, kiek RAM įdėta ir 
kokia energijos taupymo strategija įjungta...

> Temperatūra svyruoja, drėgmė svyruoja. Dulkės, tai kietosios, 
> mikroskopinės dalelės ir kiti (riebūs, agresyvūs) aerozoliai ore; buitiniu 
> atveju, tai laptop'as virtuvėje ar admin'as prie serverio sandėliuke žolę 
> rūkantis... ;-)

Nepyk, bet tau tikrai nuo žolės rūkymo prastai, bent jau šiandien :-)
Jei į HDD kas nors patenka, ala drėgmė, dulkės ar dar kas, tai tolygu žmogui 
trūkęs apendicitas. Kitaip sakant, ar spėsi duomenis ištraukt/HDD užgesint 
ir atiduoti į ištraukimą, ar ne.

> Gamintojas deklaruoja minimalų, tai drastiškai paimk pusę ar net 
> ketvirtadalį jo ir jau galėtų būti realus. Tik ir šio nepasiekia, nes 
> pabyra dėl kitų priežasčių ar tiesiog pakeičiamas...

Negaliu nieko imti drąstiškai. Yra  skirtingi prietaisai ir skirtingos jų 
naudojimo sąlygos. Atsižvelgiant į tai ir reikia rinktis situaciją, bei 
pastoviai stebėti, kaip ta situacija keičiasi (aš ne S.M.A.R.T turiu 
omenyje, o žmogišką, proaktyvų stebėjimą...).

Trumpiau - diskusija aklavietėje. Google tyrė serverių tipo aplinkoje ir 
serverių tipo apkrovas. Jų rezultatai šiomis sąlygomis ir tokiems diskams - 
teisingi. Aš pats naudoju eilę HDD ne pagal paskirtį, kaip google. Tai 
atsiperka dėl kainos, jei aptarnavimas ir sukeitimas nebrangiai 
supaprastinti, ypač kur talpa svarbiau už I/O. Bet jei žiūrint įmonės 
lygmeniu, apsimoka pirkti savo svorio klasės prietaisus (mažoms įmonėms - 
geresnius SATA/IDE, rimtesnėms - SAS, bankams ir co - FC), kiek įmanoma 
geresnius ir mažiau laiko gaišti ant fizinių gedimų, o geriau tą laiką 
skirti pridėtinės vertės kūrimui.