RAID

[source: https://namu.wiki/w/RAID]

의미

  • RAID: Redundant Array of Inexpensive/Independent Disk
  • 저장장치 여러 개를 묶어 고용량·고성능 저장 장치 한 개와 같은 효과를 얻기 위해 개발된 기법이다.

구현방법

  • 하드웨어 RAID: 별도의 RAID 카드를 장착하여 구현하는 방법이다. 속도와 안정성 모두 최고급이나 별도의 RAID카드가 필요하다는 게 단점이다.
  • 드라이버 RAID: 값비싼 RAID 카드 대신 기능을 간략화한 RAID 칩을 탑재하고 펌웨어(드라이버)로 제어하여 구현하는 방법이다. 메인보드 RAID라고도 하며, 보통 OS 진입 전 BIOS(UEFI) 메뉴에서 RAID를 구현한다. OS에 관계 없이 작동하며, OS에서는 원래 장착한 디스크 대신 가상의 BIOS(UEFI) RAID 하드웨어가 표시된다.(즉, 별도의 드라이버 소프트웨어를 통한 관리가 불가능하다.) 단, OS 를 바꿔도 묶어놓았던 레이드가 계속 유효한 대신에 메인보드를 바꾸게 되면(예를들어 인텔보드에서 AMD 보드로) 그 레이드는 더이상 사용하지 못할 가능성이 크다.
  • 소프트웨어 RAID: OS RAID라고도 한다. OS의 디스크 관리 메뉴에서 RAID를 구현하는 방법이다. Windows의 경우에는 부팅 디스크를 OS RAID로 설정할 수 없다. OS 레이드는 메인보드를 바꾸더라도 해당 디스크만 제대로 꼽아주면 계속 레이드를 사용할 수 있지만, OS 를 바꾸면 (예를들어 윈도우->리눅스) 보통 사용하지 못한다. 보통 하드웨어를 바꾸는 경우가 OS 를 바꾸는 경우보다 더 빈번하기도 하고, OS 를 바꾸면 어차피 제공되는 파일시스템 자체가 달라지기때문에 기존 레이드를 인식하건 말건간에 어차피 새로 포맷을 해줘야 하고, 포맷을 할거면 그냥 다시 레이드를 묶으면 된다.[1] 따라서, 호환성 측면에서는 메인보드 레이드보다는 OS 레이드가 좀 더 좋다.

종류
동작 방식에 따라 Level 0 ~ 6으로 분류한다. 주로 사용되는 것은 0, 1, 5, 6이며 컨트롤러 개발사에 따라 다른 방식을 제공하기도 한다.

  • RAID 0: Striping. 여러 개의 멤버 하드디스크를 병렬로 배치하여 거대한 하나의 디스크처럼 사용한다. 데이터 입출력이 각 멤버 디스크에 공평하게 분배되며, 디스크의 수가 N개라면 입출력 속도 및 저장 공간은 이론상 N배가 된다. 다만 멤버 디스크 중 하나만 손상 또는 분실되어도 전체 데이터가 파손되며, 오류검출 기능이 없어 멤버 디스크를 늘릴수록 안정성이 떨어지는 문제가 있다.
    이미지 프로세싱, 데이터베이스 캐시 등 빠른 입출력 성능을 필요로 하며, 데이터 손실이 문제되지 않는 환경에서 쓰일 수 있지만, 상용 환경에서는 위험성 문제로 RAID 5나 6을 이용하는 경우가 많다고 한다.
  • RAID 1: Mirroring. 각 멤버 디스크에 같은 데이터를 중복 기록한다. 멤버 디스크 중 하나만 살아남으면 데이터는 보존되며 복원도 1:1 복사로 매우 간단하기 때문에, 서버 또는 연구목적 PC에서 혹시 모를 데이터 손실에 대비하기 위해 사용한다.
    멤버 디스크를 늘리더라도 저장 공간은 증가하지 않으며, 대신 안정성이 크게 증가하게 된다. 상용 환경에서는 디스크를 2개를 초과해서 쓰는 경우가 드물지만, 극한 환경에서는 3개 이상의 멤버 디스크를 사용하기도 한다. 데이터 가치가 하드디스크 가격이 껌값으로 여겨질 정도로 높은 경우 (국가 비밀 문서등) 사용한다. 읽기 성능은 Non-RAID와 별 차이가 없고, 쓰기 성능은 이론적으로는 소폭 하락한다. 다만, 이 하락이 하향 평준화가 기준이므로 동일 모델 동일 주차 생산품으로 구성한 경우 크게 차이가 없을 수 있다.
  • RAID 2,3,4: 오류정정부호(ECC)를 기록하는 전용의 하드디스크를 이용해서 안정성을 확보한다. RAID 2는 비트 단위에 Hamming code를 적용하며, RAID 3, 4는 각각 바이트, 워드 단위로 패리티를 저장한다. 하나의 멤버 디스크가 고장나도 ECC를 이용하여 정상적으로 작동할 수 있지만, 추가적인 연산이 필요하여 입출력 속도가 매우 떨어진다. 쉽게말해 값들을 미적분으로 저장해서 디스크중 하나둘정도가 날아가도 일단 돌아가기는 하는 형태로, 함수를 저장하기 위해 용량을 약간 희생하지만 하드 하나만 뻑가도 망할수 있는 일부 레이드 시스템에 비해 미친듯한 신뢰성과 저장용량 효율을 보인다. 모든 I/O에서 ECC 계산이 필요하므로 입출력 병목 현상이 발생하며, ECC 기록용으로 쓰이는 디스크의 수명이 다른 디스크들에 비해 짧아지는 문제가 있어 현재는 사용하지 않는다.
  • RAID 5: Fault Tolerance using Distributed Parity Bit. 기본 원리는 RAID 4와 비슷하나, 패리티를 한 디스크에 밀어넣지 않고 각 멤버 디스크에 돌아가면서 순환적으로 저장하여 입출력 병목현상을 해결한다. N개의 디스크를 사용하면 (N-1)배의 저장 공간을 사용할 수 있다. RAID 4처럼 하나의 멤버 디스크 고장에는 견딜 수 있지만 디스크가 두 개 이상 고장나면 데이터가 모두 손실된다. 데이터베이스 서버 등 큰 용량과 무정지 복구 기능을 동시에 필요로 하는 환경에서 주로 쓰인다. 하드디스크가 하나가 사망해도 데이터가 살아있어서, 안전성이 굉장히 높아보이나 실제로는 패리티 연산을 통해서 데이터를 저장한다는 특징 때문에 취급상 유의가 필요하며 까다롭다. 다음은 RAID 5를 고려한다면 알아야 할 사항이다.
    1. RAID 0보단 안전하다는 인식과 달리 오히려 많은 량(보통 8개 이상)의 디스크를 스토리지로 묶으면, 패리티 연산오류 발생 확률이 높아져서 인해 RAID 0으로 묶은것보다 깨질 확률이 높아진다고 한다. 그러므로 대단위로 스토리지를 만드려는 사람이 있다면 RAID 6 또는 RAID 10을 권한다.
    2. 데이터가 분산 저장되어 있기 때문에 어레이가 깨지거나 보장되는 내결함 디스크 개수(RAID 5는 최대 1개)를 초과하는 경우 전자는 데이터를 살리기가 대단히 어렵고 후자는 사실상 데이터를 살릴 수 없다.
    3. RAID 1에서 언급했듯, RAID 5 볼륨의 HDD가 사망했다면 RAID 볼륨의 데이터를 먼저 백업해 두는 게 좋다. 이런 상황은 RAID 5에서 심심지 않게 발생하니 주의하도록 할것. RAID 6은 디스크 1개가 사망해도 1개의 여유가 있기 때문에 해당 상황의 위험성은 심각한 정도는 아니다.
    4. 어레이를 복구하려고 하드를 뽑았는데, 하필 정상이었던 하드를 잘못 뽑아서 어레이가 깨지는 경우도 심심치 않게 발생하니 주의하도록 할 것. 고급 레이드카드/소프트웨어 레이드들은 다시 붙이면 잘 붙긴하나, 그래도 안붙는 경우도 있으니 주의…
    5. 리빌딩을 하고 있을때 해당 어레이에 부하를 주지 말 것. 리빌딩 도중에 사용하면 리빌딩 시간이 늘어나고, 무엇보다 리빌딩 하다가 깨질 수도 있다.
  • RAID 6: Fault Tolerance using Distributed Double Parity Bit. RAID 5와 원리는 같으며, 서로 다른 방식의 패리티 2개를 동시에 사용한다. 성능과 용량을 희생해서 안정성을 높인 셈. N개의 디스크를 사용하면 (N-2)배의 저장 공간을 사용할 수 있다. 스토리지 서버와 같이 디스크를 빼곡히 꽂는(기본 10개 단위) 환경에서 RAID 5는 유지보수가 어려우며, 안정성을 높이기 위한 목적으로 주로 사용된다. 하드 하나가 고장난 RAID 5 장비에서 교체하려다가 실수로 멀쩡한 하드 하나를 뽑았다 → 데이타는 천국으로. 동일 상황에서 RAID 6는 문제가 없다. 컨트롤러가 RAID 5보다 더 비싸고, 멤버 디스크도 기본 4개 이상 확보해야 하므로 초기 구축비용이 비싸다. 하드디스크를 대단위로 물려야 하고, 데이터 안정성의 필요성이 RAID 5보다 높아야 하는 상황에서 쓰인다.

 

R_Aggregation Functions

Aggregation Functions In Standard R

  • min(x) – minimum value of vector x.
  • max(x) – maximum value of vector x.
  • mean(x) – mean value of vector x.
  • median(x) – median value of vector x.
  • quantile(x, p) – pth quantile of vector x.
  • sd(x) – standard deviation of vector x.
  • var(x) – variance of vector x.
  • IQR(x) – Inter Quartile Range (IQR) of vector x.
  • diff(range(x)) – total range of vector x.

Aggregation Functions In Dplyr Package

  • first(x) – The first element of vector x.
  • last(x) – The last element of vector x.
  • nth(x, n) – The nth element of vector x.
  • n() – The number of rows in the data.frame or group of observations that summarise() describes.
  • n_distinct(x) – The number of unique values in vector x.

[Economist] 20170222 Clean energy’s dirty secret

Clean energy’s dirty secret  환경 에너지의 불편한 진실

The renewables revolution is wrecking the world’s electricity markets.
Here’s what to do
신재생 에너지 혁명이 세계의 전기 시장을 무너뜨리고 있다. 여기 무엇을 해야할지 살펴보자. 

ALMOST 150 years after photovoltaic cells and wind turbines were invented, they still generate only 7% of the world’s electricity. Yet something remarkable is happening. From being peripheral to the energy system just over a decade ago, they are now growing faster than any other energy source and their falling costs are making them competitive with fossil fuels. BP, an oil firm, expects renewables to account for half of the growth in global energy supply over the next 20 years. It is no longer far-fetched to think that the world is entering an era of clean, unlimited and cheap power. About time, too.

태양전지 셀과 풍력 터빈이 발명된지 거의 150년이 지났지만, 그로인한 전기 생산량은 아직 전 세계 7%에 불과하다. 그런데 주목할만한 일이 벌어지고 있다. 이들 에너지원은 10여년 전만해도 에너지 시스템의 주변부에 있었지만 다른 어떤 에너지원보다도 현재 빠른 성장률을 보이고 있으며, 계속되는 원가 하락으로 화석연료와 경쟁할 수 있는 수준이 되고 있는 것이다. 원유 회사 BP 는 향후 20년 내에신재생 에너지가 전세계 에너지 공급의 절반을 차지할 것으로 전망했다. 환경 친화적이고, 무한대로 공급되며, 싼 에너지의 시대가 오는 것은 더이상 믿기 어려운 사실이 아니다.

There is a $20trn hitch, though. To get from here to there requires huge amounts of investment over the next few decades, to replace old smog-belching power plants and to upgrade the pylons and wires that bring electricity to consumers. Normally investors like putting their money into electricity because it offers reliable returns. Yet green energy has a dirty secret. The more it is deployed, the more it lowers the price of power from any source. That makes it hard to manage the transition to a carbon-free future, during which many generating technologies, clean and dirty, need to remain profitable if the lights are to stay on. Unless the market is fixed, subsidies to the industry will only grow.

그런데 여기에는 20조원의 문제가 있다. 그러한 시대로 가기 위해서는 가스를 뿜어내는 구식 파워 플랜트를 교체하고 소비자에게 전기를 공급하는 철탑과 전선을 업그레이드 하는 데에 향후 몇 십년간의 막대한 투자가 요구된다. 보통 투자자들은 안정적인 수익을 주기 때문에 그들의 돈을 전기에 투자하기를 좋아한다. 그러나 환경 에너지에는 숨기고 싶은 비밀이 존재한다. 환경 에너지가 도입되면 도입될 수록, 모든 종류의 에너지 가겨을 낮추게 된다. 이것이 탄소로부터 자유로운 미래로의 변화를 어렵게 만든다. 전력을 계속 공급하기 위해서는,  깨끗하던 오염이 되었던 많은 발전 기술이 수익성을 낼 수 있어야 하기 때문이다. 마켓이 유지되지 않는다면 산업에 투입되는 보조금만 올라갈 것이다.

Policymakers are already seeing this inconvenient truth as a reason to put the brakes on renewable energy. In parts of Europe and China, investment in renewables is slowing as subsidies are cut back. However, the solution is not less wind and solar. It is to rethink how the world prices clean energy in order to make better use of it.

정책 입안자들은 이런 불편한 진실이 재생 에너지의 발목을 잡는 이유라는 것을 이미 알고 있다. 일부 유럽과 중국에서 재생 에너지에 대한 보조금이 삭감됨에 따라 투자가 둔화되고 있다. 그러나 바람과 태양열을 줄이는 것이 솔루션은 아니다. 어떻게 세계가 환경 에너지를 더 잘 쓰기 위해 가격을 책정할 것인지를 다시 생각해보아야 한다.

 

Shock to the system 시스템에의 충격

At its heart, the problem is that government-supported renewable energy has been imposed on a market designed in a different era. For much of the 20th century, electricity was made and moved by vertically integrated, state-controlled monopolies.From the 1980s onwards, many of these were broken up, privatised and liberalised, so that market forces could determine where best to invest. Today only about 6% of electricity users get their power from monopolies.

근본적인 문제는 정부 지원의 재생 에너지가 다른 시대에 형성된 마켓에 도입된 것이다. 20세기의 상당한 기간 동안,  전기는 수직 통합된, 정부 주도의 독점기업에 의해 생산되고 공급되었다. 1980년대 이후, 많은 독점 기업들이 쪼개지고, 민영화되고, 자유주의화 되었다. 따라서 마켓은 가장 투자하기 좋은 방향으로 재편될 수 있었다. 오늘날 단 6%의 전기 사용자들만이 그들의 전력을 독점기업으로부터 공급받는다.

Yet everywhere the pressure to decarbonise power supply has brought the state creeping back into markets. This is disruptive for three reasons. The first is the subsidy system itself. The other two are inherent to the nature of wind and solar: their intermittency and their very low running costs. All three help explain why power prices are low and public subsidies are addictive.

그러나 모든 지역에서 탈탄소 전력 공급에 대한 압력이 국가를 마켓으로 다시 불러들였다. 이것은 세 가지 이유로 파괴적이다. 첫째는 보조금 제도 그 자체이다. 다른 두 가지는 바람과 태양에너지의 특성에 기인한 것인데, 간헐적인 특성과 매우 낮은 운영비이다. 세 가지 모두 전력의 가격이 낮은 것과, 정부 보조금에 중독되는 것을 설명한다.

First, the splurge of public subsidy, of about $800bn since 2008, has distorted the market. It came about for noble reasons—to counter climate change and prime the pump for new, costly technologies, including wind turbines and solar panels. But subsidies hit just as electricity consumption in the rich world was stagnating because of growing energy efficiency and the financial crisis. The result was a glut of power-generating capacity that has slashed the revenues utilities earn from wholesale power markets and hence deterred investment.

먼저, 2008년 이래 거의 800조에 달하는 과도한 보조금 투자가 시장을 왜곡시켜왔다. 사실 이것은 고귀한 이유에서 발생한 것이었다. 즉 기후 변화에 대응하고, 풍력 터빈과 태양 전지판을 포함한 새롭고 값비싼 기술에 투자하기 위한 것이었다. 그러나  에너지 효율의 증가와 경제 위기로 인해 부자 국가의 전력 소비가 정체되고 있는 시점에 마침 보조금이 부과되었다. 그 결과 전력 생산 능력(Capacity)의 과잉을 초래했고, 이는 도매 전력 시장이 벌어들이는 매출을 대폭 감소시켰으며 따라서 투자가 위축되었다.

Second, green power is intermittent. The vagaries of wind and sun—especially in countries without favourable weather—mean that turbines and solar panels generate electricity only part of the time. To keep power flowing, the system relies on conventional power plants, such as coal, gas or nuclear, to kick in when renewables falter. But because they are idle for long periods, they find it harder to attract private investors. So, to keep the lights on, they require public funds.

둘쨰로, 환경 에너지는 간헐적이라는 특성을 가지고 있다. 이는 바람과 태양의 예상치 못한 변화, 특히 날씨가 좋지 않은 국가에서의 변화는 터빈과 태양 전지판이 특정 시간에만 전기를 생산할 수 있음을 의미한다. 전력의 흐름을 유지하기 위해서는재생 에너지가 불안정할 때 가동할 수 있는 석탄, 가스, 원자력과 같은 전통적인 파워 플랜트에 의지해야 한다. 그러나, 오랜 기간동안 가동되지 않는 상태로 있기 때문에 민간 투자자들을 끌어들이는 것이 어렵다. 따라서 전력을 유지하기 위해서는 공공의 자금이 불가피하다.

Everyone is affected by a third factor: renewable energy has negligible or zero marginal running costs—because the wind and the sun are free. In a market that prefers energy produced at the lowest short-term cost, wind and solar take business from providers that are more expensive to run, such as coal plants, depressing power prices, and hence revenues for all.

모든 사람들이 다음의 세 번째 요소에 영향을 받는데, 바람이나 태양은 공짜로 얻을 수 있는 것이므로, 재생 에너지의 운영비는 무시할만한 수준이거나, 아예 들지 않는 다는 것이다. 단기적으로 시장은 최소 비용으로 생산되는 에너지를 선호할 것이고,바람과 태양이석탄 플랜트와 같이 더욱 운영비가 많이 드는 공급자로부터 시장을 가져올 것이다. 이것이 전력의 가격을 낮추게 되고 따라서 전체 수입도 낮아지게 된다.

 

Get smart 똑똑해지기

The higher the penetration of renewables, the worse these problems get—especially in saturated markets. In Europe, which was first to feel the effects, utilities have suffered a “lost decade” of falling returns, stranded assets and corporate disruption. Last year, Germany’s two biggest electricity providers, E.ON and RWE, both split in two. In renewable-rich parts of America power providers struggle to find investors for new plants. Places with an abundance of wind, such as China, are curtailing wind farms to keep coal plants in business.

재생에너지의 점유율이 증가할 수록 이런 문제들은 심각해 진다. 특히 포화 시장에서 말이다. 이러한 영향력을 가장 먼저 감지한 유럽의 경우, 전력 회사들이 수익 하락, 자산가치 하락, 회사의 붕괴로 이어지는 “잃어버린 10년”을 겪고 있다. 작년에 독일에서 가장 큰 두개의 전력회사인 E.ON과 RWE 가 모두 두개의 회사로 분사했다. 재생에너지 비중이 큰 미국 전력 회사 일부는 새로운 플랜트에 투자할 투자자들을 찾는 데에 어려움을 겪고 있다. 중국과 같이 바람이 풍부한 지역들은 석탄 플랜트 사업을 보호하기 위해 풍력 발전 단지를 줄이고 있다.

The corollary is thatthe electricity system is being re-regulated as investment goes chiefly to areas that benefit from public support. Paradoxically, that means the more states support renewables, the more they pay for conventional power plants, too, using “capacity payments” to alleviate intermittency. In effect, politicians rather than markets are once again deciding how to avoid blackouts. They often make mistakes: Germany’s support for cheap, dirty lignite caused emissions to rise, notwithstanding huge subsidies for renewables. Without a new approach the renewables revolution will stall.

결과적으로 투자가 주로 공공의 지원으로부터 이익을 얻는 방향으로 이루어짐에 따라 전력 시스템이 재 규제되고 있다. 이것은역설적으로,더 많은 국가가 재생 에너지를 지원할 수록, 전통적인 파워 플랜트에도 더 많은 돈을 지불함을 의미한다. 간헐적 생산을 방지하기 위한 “용량 요금”을 사용하기 때문이다. 사실상, 시장보다는 정치인들이 다시금 정전을 어떻게 방지할 것인지를 결정하고 있다. 그들은 종종 실수를 한다: 독일 정부의 싸고 더러운 갈탄에의 지원은, 재생에너지에 대한 엄청난 보조금에도 불구하고  배기가스 배출량을 증가시켰다.

The good news is that new technology can help fix the problem. Digitalisation, smart meters and batteries are enabling companies and households to smooth out their demand—by doing some energy-intensive work at night, for example. This helps to cope with intermittent supply. Small, modular power plants, which are easy to flex up or down, are becoming more popular, as are high-voltage grids that can move excess power around the network more efficiently.

긍정적인 소식은 새로운 기술이 문제를 해결할 수 있다는 것이다. 디지털화, 스마트 계량기와 배터리는 회사와 가정이 그들의 수요를 유연하게 조정할 수 있게 해줄 것이다. 예를 들어 에너지가 많이 드는 작업을 저녁에 할 수 있을 것이다. 이것이 간헐적인 공급을 해결하는 데에 도움이 될 수 있다. 충분한 전력을 더욱 효율적으로 공급할 수 있는 고압 송전망과 함께 용량을 쉽게 올리고 내릴 수 있는 작은 모듈화된 발전 장치가 더욱 많이 활용될 것이다.

The bigger task is to redesign power markets to reflect the new need for flexible supply and demand. They should adjust prices more frequently, to reflect the fluctuations of the weather. At times of extreme scarcity, a high fixed price could kick in to prevent blackouts. Markets should reward those willing to use less electricity to balance the grid, just as they reward those who generate more of it. Bills could be structured to be higher or lower depending how strongly a customer wanted guaranteed power all the time—a bit like an insurance policy. In short, policymakers should be clear they have a problem and that the cause is not renewable energy, but the out-of-date system of electricity pricing. Then they should fix it.

더 큰 과제는 유연한 공급과 수요를 새롭게 반영하기 위해 전력 시장을 다시 디자인하는 것이다. 날씨 변화를 반영하기 위해서는 더욱 빈번한 가격 조정이 필요하다. 에너지원이 극도로 부족한 시간에는 정전을 방지하기 위해 높은 가격이 책정되어야 할 것이다. 시장은 전기를 더 많이 생산하는 이들을 보상하듯, 전력망의 균형을 유지하기 위해 전기를 덜 사용하고자 하는 이들에게 보상을 해야 할 것이다. 요금제는 마치 보험 정책과 비슷하게, 소비자들이 전력을 얼마나 보장받기를 원하는지에 따라 더 높게, 혹은 더 낮게 책정될 수 있도록 구조화 될 수 있을 것이다. 다시 말해서, 정책 입안자들은 문제가 있다는 것을 인식하고, 그 원인이 재생에너지가 아니라 전기 요금제의 낡은 가격 체계에 있다는 것을 명확히 인지해야 한다. 그리고 그것을 해결해내야 한다.

[Book] 빅데이터가 만드는 세상 (빅토르 마이어 쇤버거, 케네스 쿠키어)

데이터 기반의 의사결정은 사람의 직관 대비 효과적인 결론에 이르게 해줄 수 있다. 사실 사람은 전체를 편향 없이 요약하는 것이 거의 불가능하다고 생각되기 때문이다.
하지만 데이터 프로세싱은 기계에게 맞기더라도 새로운 패러다임은 결국 사람의 직관, 창의성에서 나온다. 아주 창조적인 아이디어가 한 축에, 어마어마한 데이터와 그것을 분석할 수 있는 기술이 다른 한 축에서 우리 사회를 이끌어나갈 것이다. 그 주체가 민간이든 정부든 간에 말이다. 
책에서 상관성과 인과성에 대한 논의를 많이 다루었다. 나는 하나의 컨셉이 다른 하나를 완전히 대체할 수는 없다고 생각한다. 두 개념 모두가 상호 보완적으로 상황을 설명하고 문제를 해결하는 데에 사용될 것이다.
다만 어느 개념을 활용할 때 적은 비용으로 더 효과적인 결과를 얻을 것이냐의 문제에 직면하게 될 것이고, 그것은 그때 그때(문제 해결의 목적과 허용할 수 있는 오차 범위 등에 따라) 다른 결론이 날 수 있다. 
Ch1. 현재
  • (데이터가) 경제 인풋으로서 새로운 형태의 경제적 가치를 창출하는 원료가 된 것이다. 사실 제대로 된 사고방식이 가미된다면 데이터는 영리하게 재사용되어 새로운 서비스와 혁신의 원천이 될 수 있다.
  • 이때 출현한 것이 구글의 매리듀스나 맵리듀스의 오픈 소스 버전이라 할 수 있는 야후의 하둡같은 새로운 데이터 처리 기술이다. 이것들을 이용하면 이전보다 훨씬 더 많은 양의 데이터를 다룰 수 있을 뿐만 아니라, 특히 정렬되지 못하거나 전형적인 데이터베이스 표에 맞지 않는 데이터까지도 다룰 수 있다.
  • 빅데이터란 큰 규모를 활용해 더 작은 규모에서는 불가능했던 새로운 통찰이나 새로운 형태의 가치를 추출해내는 일이다.
  • 빅데이터 시대는 우리가 사는 방식, 세상과 소통하는 방식에 도전한다. 그중에서도 가장 두드러진 부분은 사회가 인과성에 대한 그동안의 집착을 일부 포기하고 단순한 상관성에 만족해야 할 것이라는 점이다.
  • 양이 바뀌면 본질이 바뀐다.
  • 빅 데이터의 핵심은 예측에 있다. (…) 빅 데이터는 엄청난 양의 데이터에 수학을 적용해 확률을 추론하려는 노력이다.
  • 샘플링은 정보 부족 시대의 발명품이다.
  • 하지만 전체 데이터를 사용하면 작은 규모의 데이터로는 파악할 수 없었던 세부 사항들을 볼 수 있다. 빅 데이터를 통해 우리는 낱개 하나하나를 선명하게 볼 수 있고, 샘플로는 알아낼 수 없는 하위 범주와 하위 시장들을 찾을 수 있다.
  • 빅데이터는 들쭉날쭉하고, 속성이 서로 다르며, 전세계 수많은 서버에 산재해 있는 경우가 많다. (…) 미시적 차원의 정확성을 잃는 대신 거시적 차원의 통찰을 얻는 것이다.
  • 앞의 두 변화로부터 세번째 변화가 생긴다. 바로 인과관계 추구라는 오래된 습관에서 멀어지는 일이다.
  • 데이터를 분석하는 사람들은 데이터가 단일 목적으로만 가치 있다고 가정하는 아날로그 패러다음에서 벗어나지 못한 경우가 너무 많았다.
  • 정보에 내포된 잠재적 가치를 끌어낼 수 있다.
  • 사람들은 데이터에서 추출할 수 있는 통찰과 인과관계를 상관과녜로 바꾸었을 때 드러날 잠재적 가치를 찾아 나선다.
  • 우리가 가진 데이터는 어마어마한 규모이고 빠르게 처리될 수 있으며 부정확성이 용인된다. 게다가 데이터의 방대한 크기 때문에 인간이 아닌 기계가 결정을 내리는 경우가 많아질 것이다.
  • 데이터를 통제하고 다루는 방식은 여러모로 달라져야 할 것이다. 지금 다가올 세상은 데이터에 기초한 예상이 난무하는 세상이다. 왜 그런 결정을 내리게 되었는지 아무도 이유를 설명할 수 없을지 모른다.
Ch2. 많아진 데이터
  • IBM의 빅 데이터 전문가 제프 조너스는 ‘데이터가 말하도록’해야 한다고 강조한다.
  • 더 큰 데이터를 수집하고 사용할 수 있게 되었건만 우리는 새로 얻은 이 자유를 아직 제대로 즐기지 못하고 있다. 정보의 이용 가능성에는 한계가 있다는 가정하에 경험을 쌓고 제도를 만들어왔기 때문이다.
  • 무작위 샘플링 조사의 정확성은 샘플 데이터를 수집할 때 무작위성을 얼마나 확보할 수 있는지에 달려 있다. 그런데 이 무작위성을 얻는 것은 쉬운 일이 아니다. 데이터를 수집하는 방식에 체계적 편향이 있을 경우 산정된 결과치는 완전히 다른 수치가 나올 수도 있다.
  • 더 문제가 되는 것은 무작위 샘플의 경우 하위 범주를 포함하도록 크기를 조정하기가 어렵다는 점이다. 결과를 쪼개 더 작은 하위 그룹으로 나누게 되면 예측이 잘못될 가능성이 높아진다.
  • (일부만 분석하는 경우) 분석 회사는 찾고자 하는 것을 싼값에 빠르게 찾을 수 있지만 미리 준비해두었던 질문이 아닌 것에는 답을 줄 수 없다.
  • 물론 어떤 때에는 샘플링 외에는 다른 대안이 없는 경우도 있지만, 이미 많은 영역에서 일부의 데이터를 수집하는 대신 가능한 많은 데이터를, 나아가 전체 데이터를 수집하는 쪽으로 추세가 바뀌고 있다.
  • 예컨대 신용카드 사기를 감지할 때는 비정상적 행태를 찾아내야 하고, 그 최선의 방법은 샘플이 아닌 데이터 전체를 분석하는 것이다.
  • 빅 데이터를 이용하는 조사는 처음 보는 바다에 낚싯대를 드리우는 것과 같다.
  • 빅 데이터는 전체 정보, 혹은 가능한 많은 정보에 의존하기 때문에 세부 사항들을 볼 수 있고 모호해질 염려 없이 새로운 분석을 할 수 있다. 또 다양한 세분화 수준에서 새로운 가설들을 확인해볼 수도 있다.
  • (빅데이터 분석이 스몰데이터 분석과 상반되는 결과 도출)네트워크의 구조의 안정성이라는 측면에서 봤을 때, 친한 친구를 많이 가진 사람보다 친하지 않은 사람들과 연락이 닿는 사람이 훨씬 더 중요할 거라고 누가 생각이나 해보았을까?
Ch3. 들쭉날쭉한 데이터
  • 지금 소굴하는 새로운 많은 상황에서는 부정밀성을 용인하는 것이 단점이 아니라 오히려 긍정적 특징일지 모른다.
  • 예컨대 규모의 이점을 얻을 수 있다면 데이터가 일부 들쭉날쭉한 경우도 수용할 수 있을 것이다.
  • 알고리즘이 좋은 것보다 데이터가 많은 편이 훨씬 더 효과적이라는 사실이 여실히 증명된 사례는 자연어 처리(natural language processing)부문이다.
  • 언뜻 직관에 반하는 소리처럼 들릴지 모르지만, 데이터를 불완전하고 부정확한 것으로 취급하면 더 나은 예측을 할 수 있고 세상을 더 잘 이해할 수 있다.
  • 그래서 기존의 깔끔한 분류 체계가 있던 자리에 새로운 메커니즘이 등장하고 있다. – ‘태그’
  • 가장 흔히 쓰이는 데이터베이스 접근 언어는 오랫동안 SQL이었다. 하지만 최근 몇 년 사이 트렌드는 noSQL이라고 하는 언어 쪽으로 크게 이동했다. noSQL은 미리 정해진 레코드 구조가 필요하지 않다. noSQL은 다양한 종류와 크기의 데이터를 수용하면서도 검색이 성공적으로 수행되게 해준다. 이런 데이터베이스 설계는 들쭉날쭉한 구조를 허용하는 대신 데이터 처리와 스토리지용 자원을 더 많이 필요로 한다.
  • 하둡은 데이터의 양이 숨 막히게 거대해서 이동이란 불가능하고 지금 그 위치에서 분석되어야 하는 것을 당연한 것으로 가정한다.
Ch4. 인과성과 상관성
  • 아마존에 이어 수천개의 웹사이트들이 고객들에게 상품, 콘텐츠, 친구, 집단을 추천할 수 있게 됐다. 사람들이 왜 그 추천 목록에 흥미를 가질 가능성이 높은 것인지 이유는 모르는 채로 말이다.
  • 어떤 현상을 분석할 때 상관성은 그 현상의 내부 원리를 알 수 있는 해결의 실마리를 제공해줄 뿐만 아니라, 무엇이 내부 원리를 아는 데 유용한 대용물이 될 수 있는지 알려준다.
  • 상관성에는 확신은 없다. 개연성이 있을 뿐이다. 하지만 상관성이 강하다면 관련이 있을 가능성은 높다.
  • 빅 데이터 시대에는 오로지 가설에만 의지해 어떤 변수를 검토할지 결정하는 것은 더 이상 효율적이지 않다.
  • 가설에 의한 접근법을 데이터에 의한 접근법으로 대체하는 것이다. 이렇게 하면 편향은 덜하고 정확성은 더 높은 결과를 훨씬 더 빠르게 얻게 될 것이다.
  • 딜로이트 컨설팅에서 개발한 아비바의 예측 모델은 건강 위험 요소를 확인하는 데 성공적인 것으로 생각되었고, 프루덴셜이나 AIG같은 다른 보험사들도 비슷한 방법을 검토했다.
  • 기본적으로 타깃이 쓰는 방법은 최대한 많은 데이터를 수집한 후 상관성이 알아서 해답을 발견하게 하는 것이었다.
  • 이것은 보통 고장이 한번에 갑자기 일어나지 않고 천천히 조금씩 진행된다는 점에 착안한 것이다. 센서 데이터가 있으면 상관분석이나 기타 유사한 방법을 통해서 고장 전에 전형적으로 발생하는 특정 패턴이나 징조가 무엇인지 알 수 있다.
  • 이런 비인과적 분석 덕분에 ‘이유’가 아닌 ‘결론’을 묻는 방식으로 세상을 이해하게 될 것이다.
  • 처음에는 이런 얘기가 직관에 반하는 소리처럼 들릴지 모른다. 무엇보다 우리는 인간이기에 인과적 연결을 통해 세상을 이해하고 싶기 때문이다.
  • 빅 데이터는 이 두 가지 방식 모두의 역할을 바꿔놓을 것이다. 첫 번째는 인과적 연관을 찾고 싶은 우리의 직관적 욕구다.
  • 빅 데이터와 상관성은 느린 사고(인과성을 검토하는 두 번째 방식)의 역할에도 변화를 가져올 것이다.
  • 상관성을 통해 먼저 중요한 변수의 단서를 포착한 다음 그것을 가지고 실험에서 인과성을 조사하면 된다.
  • 그런데 비인과적 분석은 점점 더 많은 분야에서 느린 인과적 사고보다도 더 유용하고 효율적인 툴이 되고 있다. 조심스럽게 통제된(그래서 비용과 시간이 많이 드는) 실험보다 말이다.
  • ‘이론의 종말’이라는 주장은 물리학이나 화학과 같은 실질적 분야에는 이론이 존재했지만 빅 데이터 분석에는 그 어떤 개념적 모델도 필요치 않다고 암시하는 것 같다. (…) 빅 데이터 그 자체도 이론 위에 세워져 있다. (…) 마찬가지로 데이터를 분석할 때는 툴을 선택해야 하는데 그 툴은 이론에 의존한다. 결과를 해석할 때도 우리는 이론을 적용한다. 빅 데이터의 시대에도 이론은 분명히 존재한다. 이론은 처음부터 끝까지 자리를 지키면서 다른 모든 결과를 이끈다.
Ch5. 데이터화
  • 항로를 데이터화했던 모리 이야기. 그는 이렇게 썼다. ‘이렇게 해서 젊은 선원은 경험의 빛이 자신을 비출 때까지 더듬어 앞으로 나아가는 대신 …… 자신에게는 이미 수천 명의 항해사들의 경험이 있고 그 경험이 앞길을 인도해줄 것임을 알게 될 것이다.’
  • 데이터화 vs. 디지털화. 디지털화란 아날로그 정보를 컴퓨터가 처리할 수 있도록 2진법 코드의 0과 1로 만든다는 뜻이다. 어떤 현상을 데이터화 한다는 것은 표로 만들고 분석이 가능하도록 그 현상을 수량화된 형태로 만든다는 뜻이다. (스캔한 문서 그 자체는 디지털화의 결과물이이지만, 데이터화 된 것은 아니다. 스캔한 문서 상의 텍스트가 인식이 된다면 비로소 데이터화가 된 것)
  • 수량화할 수 있는 정보를 얻기 위해서는, 즉 데이터화하기 위해서는 대상을 측정할 방법과 기록할 방법을 알아야 한다. 그러려면 딱 맞는 툴이 필요하다.
  • 수학은 데이터에 새로운 의미를 부여했다. 데이터가 이제 단순히 기록되거나 꺼내보는 것을 넘어 ‘분석’될 수 있게 된 것이다.
  • 구글은 정보가 데이터화되었을 때만 풀려날 수 있는 가치들이 정보 속에 저장되어 있다는 점을 이해했다. 그래서 구글은 디지터 이미지를 읽고 그 안에 있는 글자와 단어, 문장, 단락을 인식할 수 있는 광학식 문자인식 소프트웨어를 사용했다. 이때의 결과물은 디지털화된 사진이 아니라 데이터화된 텍스트였다.
  • 이제 책에 있던 정보는 인간 독자만이 이용할 수 있는 형태가 아니라 컴퓨터가 처리하고 알고리즘이 분석할 수 있는 형태가 됐다.
  • 컬처로믹스: 텍스트의 양적 분석을 통해 인간 행동과 문화 트렌드를 이해하는 컴퓨터 어휘학이다.
  • 출판사들은 수년간 전자책을 가지고 실험해왔지만, 책의 핵심 가치를 콘텐츠라고 보았지 데이터라고 생각하지는 않았기에 그들의 비즈니스 모델 역시 이런 생각에 기초해 만들어졌다.
  • 일단 세상이 데이터화되고 나면 정보의 잠재적 용도를 제한하는 것은 기본적으로 개인의 창의력뿐이다.
  • 현실의 수많은 측면을 데이터로 바꾼다는 것이 지금 사람들에게는 참신하게 보일 수도 있다. 하지만 미래에는 분명 이것을 당연히 주어져 있는 것으로 여길 것이다.
Ch6. 가치
  • 데이터는 오랫동안 소중한 가치를 지니고 있엇지만 사업을 운영하는 핵심적인 것들에 대한 보조적 역할로만 비쳐지거나 지적재산 혹은 개인 정보라는 상대적으로 좁은 범위에 한정된 것으로 여겨졌다. 그러나 빅 데이터 시대에는 모든 데이터가 그 자체로 소중하게 여겨질 것이다.
  • 데이터는 같은 목적으로 여러 번 사용될 수도 있지만, 서로 다른 여러 목적으로 활용될 수도 있다는 점이 더 중요하다. 빅 데이터 시대에 얼마나 많은 정보가 우리에게 가치를 가질지 이해하려면 이 점을 잘 알아야 한다.
  • IBM은 운전자가 자동차 배터리를 충전해야 할 최적의 시간과 장소를 결정할 수 있었다. 또한 충전소는 어디에 짓는 것이 가장 좋을지도 밝혀냈다.
  • 이 시스템은 한 가지 목적으로 생성된 정보를 다른 목적으로 사용한다. 다시 말해 데이터가 1차적 용도에서 2차적 용도로 옮겨간다.
  • 데이터의 진짜 가치는 바다 위에 떠 있는 빙산과 같다. 처음에는 아주 조그만 부분밖에 눈에 봉지 않지만 수면 아래에는 많은 부분이 숨겨져 있다.
  • 데이터의 옵션 가치를 깨우는 강력한 방법이 세 가지 있다. 바로 기본적 재사용, 데이터 집합 합치기, ‘반값 할인’찾기다.
  • 데이터 재사용이 가지는 가치는 커다란 데이터 집합을 수집, 통제하면서도 지금 당장은 제대로 활용하고 있지 못한 오프라인 위주의 전통적 기업과 같은 회사들에게는 좋은 뉴스다. 이들은 아직 손대지 않은 정보의 샘을 깔고 앉아 있는 것인지도 모른다.
  • 하나의 데이터 집합을 다른 것과 결합해야만 잠들어 있는 가치를 깨울 수 있는 경우도 있다. 그리고 이런 경우 데이터 집합들은 서로 완전히 다른 종류일지도 모른다.
  • 데이터 재사용을 가능하게 만드는 한 가지 방법은 데이터를 처음 설계할 때부터 여러 목적에 맞출 수 있게 확장 가능하도록 만드는 것이다.
  • 다양한 종류의 데이터, 혹은 더 많은 데이터를 수집하기 위해 들어가는 추가 비용은 높지 않은 경우가 많다. 따라서 처음부터 잠재적인 2차 용도를 염두에 두고 확장 가능한 데이터, 그리고 최대한 많은 데이터를 수집하는 편이 합리적이다.
  • 모든 데이터가 같은 속도로 혹은 같은 방식으로 가치가 하락하지는 않는다. 그렇기 때문에 일부 회사들은 데이터를 최대한 오래 보관하려고 애쓴다.
  • 전자책 단말기는 이용자가 치는 밑줄, 여백에 적는 메뫄지 기록한다. 읽기라는 행위는 오랜 세월 혼자만 하는 일이었지만 이런 정보들이 모이면 읽기도 이제 일종의 공동 경험이 된다. 단말기에 데이터 잔해가 축적되면 출판사나 저자들은 이전에 알 길이 없었던 내용을 수량화된 형태로 알 수 있다.
  • 유다시티, 코세라, 에드엑스 같은 온라인 교육 프로그램도 생각해볼 수 있다. 이들 프로그램은 웹상에서 학생들의 반응을 추적해 교육적으로 어떤 것이 가장 효과적인지 알아낸다. 강의를 듣는 학생이 수만 명 규모이므로 엄청난 양의 데이터가 만들어진다. 교수들은 학생들 중 다수가 강의 중 특정 부분을 반복해서 시청했다는 사실을 알 수 있고, 이를 통해 학생들이 그 부분을 잘 이해하지 못했음을 짐작할 수 있다.
  • 최근에는 정부가 보유한 데이터에서 가치를 가장 잘 추출하는 방법은 민간 부문과 사회에 일반적 저븐권을 허용하는 것이라는 생각이 커지고 있다.
  • 전 세계적으로 ‘정부 데이터 개방’ 운동이 수없이 일어났다. 정부는 수집한 데이터의 관리인에 불과하고 민간 부문과 사회가 정부보다 혁신적이므로 정부는 시민들을 위해, 그리고 상업적 목적으로도 데이터를 개방해야 한다는 주장이다.
  • 회계의 어려움과 법적 책임에 대한 걱정이 완화되면 데이터의 가치가 새로운 자산 종류로서 기업 재무제표에 표시될 것은 거의 확실한 일이다.
  • 데이터는 플랫폼이다. 새로운 재화와 비즈니스 모델을 만들어내기 위한 벽돌이기 때문이다.
Ch7. 영향
  • 지금까지 생겨난 빅 데이터 회사들은 제공하는 가치에 따라 세 종류로 나눌 수 있다. 그 가치는 각각 데이터, 기술, 아이디어다.
  • 세 번째는 아이디어, 즉 빅 데이터 사고방식이다. 어떤 회사들은 성공의 주된 원인이 데이터나 노하우에 있지 않다. 이들 기업이 두각을 나타내는 것은 설립자나 직원들에게 데이터에서 새로운 형태의 가치를 추출할 수 있는독창적인아이디어가 있기 때문이다.
  • (…) 하지만 기술에 대한 지대한 관심과 데이터의 중요성을 얕보는 풍조는 얼마 못 가 사라질지도 모른다. 업계가 진화함에 따라 배리언이 말하는 기술이 흔해지면 인력 부족은 극복될 것이기 때문이다.
  • 외부의 기술 회사가 얼마나 유용한 서비스를 제공할 수 있는지 보여주는 또 다른 놀라운 사례를 의료 데이터 영역에서 찾을 수 있다. 워싱턴 D.C.에 있는 메드스타 워싱턴 병원 센터는 마이크로소프트 리서치와 공동으로 마이크로소프트 아말가라는 소프트웨어를 사용해 익명 처리된 다년간의 의료 기록(환자에 대한 인구통계적 자료, 테스트 결과, 진단, 치료 등)을 분석했다. 재입원율과 감염률을 줄일 방법을 찾기 위해서였다. 이 두 가지는 의료 서비스 분야에서 가장 높은 비용을 차지하는 영역에 속했으므로 이들 비율을 낮출 수만 있다면 엄청난 비용을 절약할 수 있었다.
  • 빅 데이터를 보유한 회사들은 데이터에서 가치를 추출하기 위해 전문가에게 의지한다. 아낌없는 찬사와 ‘데이터 닌자’같은 근사한 직명에도 불구하고 기술 전문가로 사는 것은 겉보기만큼 항상 매력적이지는 않다.
  • 세 번째 카테고리는 빅 데이터 사고방식을 가진 회사와 개인들로 이뤄진다. 이들의 강점은 남들보다 먼저 기회를 알아본다는 점이다. 그 기회를 실행에 옮길 데이터나 기술이 없더라도 말이다. 아마도 그런 것을 가지지 못한 외부인이기 때문에 오히려 자유로운 상상이 가능한 것일 수도 있다. 실행 가능성에 구애받지 않고 무엇이 가능한지를 보는 것이다.
  • 요즘 자동차에는 마이크로칩이나 센서, 소프트웨어가 장착되어 있어 차량을 서비스받을 때 성능에 관한 데이터를 자동차 회사의 컴퓨터로 업로드한다. 전형적인 중간급 차량의 경우 이제 보통 40여 개의 마이크로프로세서를 장착하고 있다.
  • 빅 데이터의 가치 사슬에서 가장 큰 가치를 손에 쥐는 사람은 누구일까? 현재까지의 대답은 빅 데이터 사고 방식을 가진 자들, 즉 혁신적 아이디어를 가진 쪽인 것 같다.
  • 빅 데이터의 초기 단계에 불과한 현재로서는 아이디어와 기술이 가장 큰 가치를 지닌 것 같다. 하지만 결국에 가면 대부분의 가치는 데이터 자체에 있을 것이다. 왜냐하면 우리는 정보를 가지고 더 많은 것을 할 수 있게 될 것이고, 데이터 보유자들은 자신이 소유한 자산의 잠재적 가치를 더 잘 알게 될 것이기 때문이다.
  • 하지만 장기적으로 데이터 보유자들이 부상할 것이라는 전망에는 주의가 필요한 중요한 측면이 있다. 일부 경우에는 ‘데이터 중개인’들이 나타나서 복수의 출처로부터 데이터를 수집하고 취합한 후 혁신적인 일들을 할 것이라는 점이다.
  • 인릭스는 독립 데이터 중개인의 전형이다. 인릭스는 수많은 라이벌 자동차 회사들로부터 정보를 수집하기 때문에 그 어느 회사가 단독으로 할 수 있는 것보다 더 가치 있는 결과를 만들어낸다.
  • 예일 대학의 경제학자이자 법학 교수인 이언 에어스는 자신의 저서인 <슈퍼 크런처스>에서 사람들은 직감이 들더라도 통계 분석 때문에 어쩔 수 없이 다시 한 번 생각하게 된다고 주장했다.
  • 우리는 많은 영역에서 전공별 전문가들의 영향력이 줄어드는 것을 보고 있다. 미디어 영역을 보면 허핑턴 포스트나 고커, 포브스 같은 웹사이트에서 어떤 콘텐츠가 만들어지고 발표될지는 사람인 편집자가 아니라 데이터가 정기적으로 결정한다.
  • 이것은 직장에서 성공하는 데 필요한 역량이 바뀌고 있음을 보여준다.
  • 분명 전공별 전문가들은 사라지지 않을 것이다. 다만 그 우월성이 줄어들 것이다. 이제부터는 빅 데이터 전문가들과 무대를 나눠 써야 하기 때문이다. 인과성이라는 왕자가 상관성이라는 거지에게도 세상의 이목을 나눠줘야 하는 것처럼 말이다.
  • 수학과 통계학, 그리고 약간의 프로그래밍과 네트워크 과학이 직장 생활의 기본이 될 것이다.
  • (경제학에서 얘기하는) 규모는 중요하지만 여기에도 변화가 있었다. 이제 중요한 것은 데이터의 규모다. 대량의 데이터를 보유하면서 더 많은 데이터를 쉽게 수집할 수 있어야 한다.
  • 개인 정보에 대한 소유권은 개별 소비자들에게 전에 없던 힘을 실어줄지도 모른다. 사람들은 누가 얼마만큼 자신의 데이터를 사용 허가 받을지 스스로 결정하기를 바랄 수도 있다.
Ch8. 리스크
  • 사람들이 행동하기도 전에 그들을 판단하고 벌주기 위해 빅 데이터 예측을 사용한다면 이런 일이 벌어질 수 있다. 그리고 이것은 공정, 정의, 자유 의지라는 개념을 무효화시켜버린다.
  • (빅데이터의 2차 용도로의 사용에 대하여) 아직 존재하지도 않는 목적을 위해 기업들은 어떻게 고지를 할 수 있을까? 아직 모르는 용도에 대해 개인들은 어떻게 고지에 입각한 동의를 할까?
  • 빅 데이터 시대에는 사생활을 보호하기 위해 오랫동안 사용되어온 세 가지 핵심 전략들(개별적 고지와 동의, 탈퇴, 익명화)이 모두 효력을 많이 상실한다.
  • 기업과 정부가 우리의 개인 정보를 알 수 있다는 사실이 골치 아픈 것만큼이나 새롭게 빅 데이터의 문제점으로 부각되고 있는 것이 있다. 바로 우리를 판단하기 위해 예측을 사용하는 일이다.
  • 미래에 일어날 가능성이 있는 어떤 행동에 대해 그 사람을 비난하는 것은 정의의 기초를 무너뜨리는 일이다. 정의란 어떤 사람이 무슨 일을 저질렀을 때에만 그에게 책임을 물을 수 있는 것이다.
  • 빅 데이터 예측이 완벽하다면, 알고리즘이 우리의 미래를 완전무결하고 분명하게 예견할 수 있다면, 앞으로 우리에게 행동의 선택권이란 없을 것이다.
  • 그런 시스템이 있으면 사회는 좀 더 안전하거나 효율적일지도 모른다. 하지만 그렇게 된다면 우리를 인간으로 만들어주는 근본적 부분(자기 행동을 자기가 선택하고 그것에 대해 책임을 지는 것)이 파괴될 것이다. 빅 데이터는 사회에서 인간의 선택을 집단화하고 자유의지를 폐기하는 데 사용되는 툴이 되어 있을 것이다.
  • 상관성에 기초하고 있는 빅 데이터는 우리가 인과성을 판단하고 개인의 책임을 묻는 과정을 돕기에는 전적으로 부적합한 툴이다.
  • 문제는 인간이 세상을 원인과 결과라는 렌즈를 통해 보려고 한다는 점이다. 그래서 빅 데이터는 인과적 목적에 남용될 위험을 언제나 안고 있다.
  • (데이터의 독재) 탁월한 생각은 데이터에 의존하지 않는다. 스티브 잡스가 수년간 지속적으로 맥 노트북을 개선할 때는 현장 보고서를 기초로 삼았을지도 모른다. 하지만 그가 아이팟이나 아이폰, 아이패드를 출시할 때 기초로 삼았던 것은 자신의 직관이지 데이터가 아니었다.
Ch9. 통제
  • 수십 년간 전 세계적으로 사생활 보호법의 핵심적 원칙은 개인들에게 통제권을 주는 것이었다. (…) 인터넷 시대에는 ‘고지와 동의’라는 정형화된 시스템으로 바뀐 경우가 많았다. 그러나 빅 데이터 시대에는 데이터의 가치가 많은 부분 2차적 용도에 있다. 그리고 이 2차적 용도는 데이터가 수집될 당시에는 상상하지 못했던 것일 수도 있기 때문에 바로 앞에서 말한 것과 같은 방법은 더 이상 적합하지 않다.
  • 대중으로부터 데이터 이용자에게도 책임을 이전하는 것은 여러 가지 이유에서 합리적이다. 우선 해당 데이터를 어떻게 사용할 의도인지에 대해서는 그 누구보다 회사가, 소비자나 규제 기관보다 훨씬 더 잘 안다. 자체적으로 평가를 실시함으로써(혹은 전문가를 고용해서 실시함으로써) 회사는 회사 기밀인 사업 전략이 외부에 노출될 위험을 피할 수 있다. 그리고 가장 중요한 것은 데이터의 2차적 용도로 인해 가장 많은 이득을 챙기는 것은 데이터 이용자이므로 그들이 자신들의 행동에 대해 책임을 지고 검토 의무도 지는 편이 공정하다.
  • 데이터의 잠재적 가치를 꺠워야만 현대판 모리 선장들이 스스로를 위해 혹은 사회를 위해 데이터로부터 최대한의 가치를 끌어낼 수 있기 때문이다.
  • 개인 동의에서 데이터 이용자의 책임으로 통제의 형태가 바뀌는 것은 빅 데이터를 효과적으로 다스리기 위해 꼭 필요한 근본적 변화다.
  • 우리는 인간 행위 원칙이 확실히 보장되어야만 정부가 단순한 빅 데이터 분석이 아니라 진짜 행동에 기초해서 우리의 행위를 판단할 것임을 보장할 수 있다.
  • 빅 데이터 규제의 큰 기둥은 ‘객관적으로’데이터를 분석해서 범법자일 가능성을 판단하는 것이 아니라, 계속해서 사람들을 개인적 책임과 실제 행동에 의거해 판단할 거라는 확실한 보장이다. 그래야만 인간을 인간으로서 대우하는 것이다.
  • (…) 이와 같은 시나리오들에서 우리는 빅 데이터 예측과 그 배후에 있는 알고리즘 및 데이터 집합이 블랙박스가 되어버릴 위험이 있다는 것을 알 수 있다. 책임도, 추적 가능성도, 확신도 없는 블래각스 말이다.
  • 알고리즈미스트 (조직 내/외부에서 빅 데이터 예측의 정확성가 유효성에 대한 검토)… 이 새로운 전문직 종사자들은 컴퓨터 과학, 수학, 통계학 분야의 전문가들일 것이다. 그리고 이들은  빅 데이터 분석과 예측의 검토자로서 활동할 것이다.
Ch.10 다음
  • 플라워스는 뉴욕 시의 첫 ‘분석 국장’이 됐다.
  • 플라워스 팀은 대체로 수집된 이후 재사용된 적이 없는, 몇 년간 묵혀 있던 엄청난 양의 데이터를 새로운 방식으로 활용해 진짜 가치를 뽑아냈다. 다량의 정보를 사용하자 더 적은 정보로는 찾아낼 수 없었던 연결점들을 찾을 수 있었다.
  • 궁극적으로 빅 데이터는 ‘정보사회’라는 단어가 약속했던 것을 마침내 완수하는 순간을 나타낸다. 데이터가 무대의 중심에 서는 것이다. 그동안 우리가 수집해놓은 그 모든 디지털 비트들이 이제는 참신한 방식으로 활용되어 새로운 목적에 쓰이고 새로운 형태의 가치를 만들어낼 수 있다.
  • 정확하고 정밀하며 말끔하고 엄밀한 데이터에 집착하는 대신 기준을 조금은 더 느슨하게 풀어줘도 좋다.
  • (…) 하지만 발명을 촉발하는 것은 데이터가 말해주지 않는 무엇이다. 아무리 많은 양의 데이터가 있어도 확인할 수도, 입증할 수도 없는 어떤 것이 발명을 낳는다.
  • 빅 데이터 세상에서 키워나가야 할 것은 우리의 가장 인간적인 특징들, 즉 창의성, 직관, 지적 포부 등이다. 독창성이야말로 진보의 원천이니까 말이다.

[Book] 12 위대한 경영의 요소 (로드 와그너/제임스 하터)

Gallup’s Q12
  1. 업무의 구체화: 회사에서 내게 무엇을 기대하는지 알고 있다
  2. 자원 확보: 업무에 필요한 재료와 장비를 갖추고 있다
  3. 재능 대 업무의 적합도: 능력을 충분히 펼칠 기회가 자주 있다
  4. 긍정적 피드백: 지난 일주일간, 업무성과에 대해 인정과 칭찬을 받았다
  5. 공동체 의식: 나를 진심으로 배려하는 누군가가 있다
  6. 멘토링: 나의 발전을 후원하는 사람이 있다.
  7. 의사결정 참여도: 내 의견이 비중 있게 반영된다
  8. 사명감의 공유: 회사의 목적이 내 업무의 가치를 높여준다
  9. 팀워크: 팀원 모두가 훌륭한 실적을 위해 최선을 다한다
  10. 프렌드십: 회사에 최고의 친구가 있다
  11. 발전적 평가: 지난 6개월간, 나의 발전에 관심을 보인 사람이 있다
  12. 발전 욕구의 충족: 지난 1년간, 배우고 성장할 기회가 충분했다

[Book] 정글만리 (조정래)

  • 조정래 작가의 <풀꽃도 꽃이다>를 읽고나서, 조정래 작가의 유명세에 비해 너무 읽은 작품이 없다 싶어서, 그리고 상황을 세세하게 묘사하는 필력에 글이 참 잘 읽혀서 가장 최근 작이었던 <정글만리>를 읽기 시작했다.
  • 중국어를 공부하고 있는 사람한테, 중국에 대해 이해하기에 좋은 책이라는 느낌.
  • 특히 중국의 급격히 팽창하고 있는 경제, 그 속에서 치열하게 땅따먹기를 하고 있는 대기업, 중소기업, 신생기업, 비즈니스맨, 실제 피땀흘리는 농민공들의 정상적이고 또 비정상적인 삶, 그들의 아들 딸들의 이야기가 숨막히게 펼쳐진다.
  • 사회주의 사회인 것이 무색하게 (사실 현재 중국의 정치/경제 구조에 대한 지식은 별로 없다) ‘돈이 최고의 가치’가 되는 것이 어찌 보면 당연한 결과인 것 같기도 하고, 안타깝기도 하다. 뭐 우리나라도 스케일이 달라서 그렇지 마찬가지이지 않겠는가!
  • 한편으로는 서양의 무조건적인 중국을 하대하는 태도도 적나라하게 그려져있다. 가장 큰 시장임에도 불구하고 단지 돈을 버는 수단 정도로만 생각하는 사람들. 그러나 앞으로 중국이 전 세계에 미치는 영향은 피하려 해도 피할 수 없는 것이리라. 우리 자식들 세대에는 어쩌면 중국 대기업 못들어가서 안달일 수도 있을 것이다.
  • 3권 까지 다 읽었는데 솔직히 스토리가 더 이어져야만 하는데 중간에 끝난 것 같다는 느낌이 들기는 했다.

[Book] 낭만적 연애와 그 후의 일상 (알랭드 보통)

  • 뚜렸한 파국이나 큰 행복없이 수십 년 동안 지속되는 관계가 사랑의 진척에 관한 이야기로서 마땅히 대접받지 못하고 러브스토리 밖에 머무는 것은 흥미롭고도 걱정스러운 일이다.
  • 우리는 사랑이 어떻게 시작하는지에 대해서는 과하게 많이 알고, 사랑이 어떻게 계속될 수 있는지에 대해서는 무모하리만치 아는 게 없는 듯하다.
  • 사랑은 우리의 당황스럽고 난처한 영혼에 대한 연인의 통찰력에 바치는 감사의 배당금이다.
  • 이제부터는 이 흐름 속에 더 오래 견디면서 촘촘한 체로 흥미로운 알갱이들을 잡아내야 하는 문제가 되었을 뿐이다.
  • 토라짐의 핵심에는 강렬한 분노와 분노의 이유를 설명하지 않으려는 똑같이 강렬한 욕구가 혼재해 있다.
  • 토라진 연인에게 베풀 수 있는 가장 큰 호의는 그들의 불만을 아기의 떼쓰기로 봐주는 것이다.
  • 잘 들어주는 사람은 다른 사람들이라면 마음속에 얼마간 담아둘 혼란을 대수롭지 않게 여긴다. 이미 경험을 통해 모든 게 결국 제자리로 돌아온다는 것을 알기 때문이다.
  • 마음의 전이에 말려들면 우리는 사람이나 상황을 믿어주는 능력을 잃어버린다. 우리는 불안에 빠져 즉시 과거가 지정해놓은 최악의 결론으로 나아간다.
  • 우리가 익혀두어야 할 것은 우리가 한두 가지 면에서 다소 제정신이 아니라는 점을 쾌히 인정할 줄아는 간헐적인 능력이다.
  • 신뢰하고 협력적인 분위기에서는 두 프로젝트-가르치기와 배우기, 상대방의 결점을 환기하고 상대방의 비판을 허용하기-가 결국 사랑의 참된 목적에 충실하다는 점을 인정하게 될 것이다.
  • 아이들은 결국 나이가 몇 배나 많은 사람들에게 예상치 못한 선생이 되어-그들의 철저한 의존성, 자기중심주의, 연약함을 통해-완전히 다른 종류의 사랑에 대한 수준 높은 교육을 제공한다. 이 사랑은 상호 호혜를 강렬히 원하지도 성급하게 후회하지도 않고, 타인을 위해 자아를 초월하는 것만을 진정한 목표로 한다.
  • 우리는 또한 남의 종이 되는 것이 굴욕이 아니라 정반대라는 것을 배운다. 나 자신의 왜곡되고 만족을 모르는 본성에 응해야 하는 피곤한 의무에서 우리를 해방시켜주기 때문이다. 그렇게 나 자신보다 더 중요한 인생의 목표를 부여받았다는 위안과 특권을 알게 된다.
  • 이 아이는 어른들에겐 이미 지루해져버린 단순한 것들에 열광한다.
  • 많은 사람들이 아이들에게 다정함을 보이는 세상에서 산다는 건 멋진 일이다. 우리가 다른 사람의 어린애 같은 면에 조금 더 다정함을 보이는 세상에서 산다면 더욱 멋질 것이다.
  • 부모가 아무리 겸손하게 부인하고 남들 앞에서 자신의 야망을 아무리 낮춰 말해도 아이가 생기면-적어도 처음에는-완벽함을 맹렬히 추구한다. 그저 또 하나의 평범한 인간이 아니라 완벽함의 특별한 표본을 창조하려 하는 것이다. 평범함은 통계상 정상임에도 결코 최초의 목표가 되지 못한다. 그 결과 아이를 어른으로 키우는 데 너무 막대한 희생을 치른다.
  • 자신이 더 힘들게 살고 있다는 자기 위안식의 결론을 피하려면 초인적인 지혜가 필요하다. (부부가 모든 면에서 평등하기를 기대하는 면에 대하여)
  • 오늘날 부모들이 겪는 어려움은 부분적으로 위신(prestige)을 분배하는 방식 탓에 발생한다. 부부는 매시간 실용적인 요구에 시달릴 뿐 아니라, 그런 일이 굴욕적이고 시시하고 무의하다고 생각하고, 따라서 단지 요구를 견뎌냈다는 이유만으로 누군가를 동정하거나 칭찬해주는 걸 꺼린다.
  • 우리 눈에 정상으로 보일 수 있는 사람은 우리가 아직 깊이 알지 못하는 사람뿐이다. 사랑을 치유하는 가장 좋은 방법은 사람을 더 깊이 알아가는 것이다.
  • 그들은 낭만적인 면에서 가장 필요한 선물, 즉 그들 자신의 취약점이 적힌 안내서를 주고 받지 못한다.
  • 성공의 전형들에 맞설 때 그의 삶은 깊은 실망을 안겨주었다. 하지만 결국 실패에 연연하는 것은 위대한 성취가 아님을 알게 된다. 씩씩한 태도로 자신의 인생을 관대하고 희망적으로 보는 관점을 찾고 스스로에게 친구가 될 줄 알아야 한다.
  • 연인이 ‘완벽하다’는 선언은 우리가 그들을 이해하지 못했다는 징표에 불과할 수 있다. 어떤 사람이 우리를 상당히 실망시켰을 때 그 순간 우리는 그 사람을 알기 시작했다고 주장할 수 있다.
  • 어떤 사람도 다른 누군가를 정확히 이해하고 충분히 공감하지 못한다.
  • 중요한 여러 분야에서 파트너가 우리보다 더 현명하고 합리적이고 성숙하다는 것을 인정할 떄 우리는 결혼할 준비가 된 것이다. 우리는 그들에게서 배우기를 바라야 하고, 그들에게 지적당하는 것을 인내해야 한다. 또한 다른 순간에는 최고의 교사로서 모범을 보이고, 소리를 지르거나 상대방도 알리라 지레짐작하지 않고 우리의 제안을 전할 준비가 되어 있어야 한다. 이미 완벽한 사람만이, 서로 가르친다는 생각은 사랑이 아니라고 일축할 수 있다.
  • 불안에 굴복하지 않을 용기, 좌절하여 남들을 다치게 하지 않을 용기, 세상이 부주의하게 입힌 상처를 감지하더라도 너무 분노하지 않을 용기, 미치지 않고 어떻게든 적당히 인내하며 결혼 생활의 어려움들을 극복할 용기
나의 일상에서의 감정을 너무 정확하게 묘사하는 문장들이 많아 뜨끔하면서도 깊히 공감하였고 작가가 제시하는 일종의 솔루션에도 고개를 끄덕였다.
미래에 아이가 생기면 완전히 새로운 차원의 사랑을 경험하겠구나 하는 느낌도 조금 생긴 것 같고.
알랭드 보통의 사랑에 대한 소설을 더 찾아봐야겠다는 생각이 든다.

[Book] Leading Change (Robert E. Quinn)

3. 리더십의 근원적 상태에 진입하기
  • 나는 내 자신의 안위는 내가 책임지고 있다는 사실을 받아들이게 됐다. (중략)
    내 안의 변화는 내가 스스로를 바라보는 방식을 완전히 바꿔놓았으며 그가 나를 대하는 방식도 완전히 바꿔 놓았다.
  • 결국은 내가 원하는 삶을 실제 살아내기 위해 실행하는 과정속에서 gap이 축소 되고 그 결과로 나에 대한 자신감이 생기고,
    스스로를 보는 관점 뿐만 아니라 주변사람들이 나를 보는 관점 또한 변화하는 것이 아닌가. (주변과의 관계에 변화가 생기는 것)
4. 개인에게 활력 불어넣기
  • 72 우리를 소진 시키는 것은 우리의 이중성과 자기자신에게만 관심의 초점을 맞춘 태도다. 우리가 목적 중심적이고 주체적이며 타인에게 관심을 두고 열린 사고로 외부상황을 받아들이면 우리는 자신도 모르는 내적인 에너지를 발견하게 된다.
6.나를 변화시켜 타인까지 변화시키기
  • 98 리더십의 근원적 상태에 도달한 사람들의 에너지와 품성은 전염된다. 우리는 스스로 변화하면서 변화의 살아있는 상징이 된다.
  • 우리 주변에 있는 사람들은 우리에게 이끌려 역량을 강화한다. 이런 과정을 통해 ‘발생적 조직화(emergent organizing)’가 이루어진다. 발생 조직화란 전통적인 개념의 리더 한 사람이 변화를 이끄는 것이 아니라 여러 명이 조직을 구성해나가는 과정을 이그는 것이다.
  • 렐프 네이더 “나는 리더십의 기능이 더 많은 리더를 만드는 것이라는 전제로 일을 시작했다. 추종자를 만드는 것이라고는 생각하지 않았다”
  • 101 우리가 과거 경험으로부터 얻은 지식은 자산임에는 분명하다. 그러나 성공적인 변화를 이끄는 요소는 실제 직면하고 있는 상황에서 배워나갈 수 있는 능력이다. 지식은 유용하긴 하지만 변화 과정에서 핵심적인 사항은 학습 능력인 것이다.
  • 105 변화를 이끄는 리더는 뜻을 함께하는 팀을 발전시킬 필요가 있는데, 그 팀은 최고 경여진이 아닌 경우가 많다. 오히려 공식적인 구분을 뛰어넘는 네트워크로 구성될 때가 많다. 시간이 흐를수록 변화는 더욱 많은 사람에게로 확산되고 결국 변화를 결정짓는 다수의 사람들이 구성된다.
  • ‘새로운 방식으로 도전을 받아들이고 함꼐 해결책을 찾아가려는 결정적인 다수’ 이것이 바로 사회적 변혁이 이루어지는 방식이다
(우리 자신이 변할 때 조직도 변한다)
  • 106 “불안정한 상황과 이기적이고 용기가 부족한 내 자신에 대항했기 때문에 이 모든 일들이 가능해졌다”
(인간관계에서 변화를 이끌어내는 3가지 일반적인 방법)
  • 일반적인 상태에서 우리는 대체로 변화를 이끌기 위해 두 가지 전략을 쓴다. 하나는 변화에 대해 논리적인 주장을 하는 말하기(Telling) 이고 다른 하나는 해고나 배척 등 위협적인 수단을 쓰는 강제하기(Forcing)이다.

[Book] 구글의 아침은 자유가 시작된다

서장. 구글 법칙이 유용한 이유
  • 27 “직원들이 경영자의 리더십을 신뢰할 때 회사 브랜드의 적극적인 홍보자가 되어 가족과 사회 그리고 주변 환경에서 적극적인 변화를 이끌어냅니다. 그 결과로 기업 수익률은 자동으로 개선될 수밖에 없습니다. 생산성이 높아지고 기업은 더욱 빠르게 성장하며 고객은 만족합니다”
  • 29 세상에서 가장 재능이 있는 사람들은 물리적으로 점점 더 쉽고 빠르게 직장을 옮길 수 있으며, 기술을 통해 점점 더 많이 연결되고 또 점점 더 찾아내기 어려워지고 있다.
  • 30 구글의 접근법은 복잡하게 얽힌 이런 문제들의 매듭을 풀어내는 것이다. 우리는 관리자가 갖고 있는 권위와 권한을 의도적으로 떼어내 직원에게 부여한다. 구글에서 의사 결정자가 일방적으로 결정할 수 없는 사항들은 다음과 같다.
    • 누구를 고용할 것인가?
    • 누구를 해고할 것인가?
    • 직원의 성과를 어떻게 평가할 것인가?
    • 어떤 직원의 연봉 인상과 상여금 혹은 스톡그랜트의 수준을 어떻게 결정할 것인가?
    • 누구를 팀 관리 우수자로 선정할 것인가?
    • 누구를 승진시킬 것인가?
    • 코드의 품질이 어느. 정도로 완성됐을 때 이 코드를 소프트웨어에 탑재할 것인가?
    • 어떤 제품을 출시할 때 이 제품의 최종 디자인을 무엇으로 결정할 것인가?
  • 이와 관련된 사항들의 결정은 동료  집단이나 특별한 위원회 혹은 독립적이면서도 헌신적인 팀이 내린다.
  • 34 사람은 본래 선하다는 믿음 그리고 직원을 기계가 아니라 회사의 주인처럼 대할 용기만 있으면 된다. 기계는 입력된 일만 하지만 회사의 주인은 회사가 팀이 성공하는 데 필요한 일이면 무엇이든 하기 때문이다.
  • 대단한 창업, 대단한 사업, 대단한 일은 즐거워야 한다. 당신이 전력을 다해 일을 하면서도 어떤 즐거움도 느끼지 못한다면 뭔가가 잘못 됐을 가능성이 높다.
1장. 창업자가 된다는 것
  • 42 “래리와 세르게이 두 사람이 모두 몬테소리 교육을 받고 자랐다는 사실을 알지 못한다면 절대로 구글을 이해할 수 없다” 몬테소리 교육법은 개별 아동의 학습 욕구와 개성에 맞춤화되어, 아이들이 궁금한 것은 무엇이든 물어보고 생각한 대로 행동하고 또 무언가를 만들어내도록 권한다.
  • 45 “의미가 있고 큰 영향을 미치는 일에 종사하고 싶은 것, 사실 이것이 우리가 사는 세상에서 정말 필요하지만 부족한 일이다. 하지만 구글에서 우리는 이렇게 하고 있다고 나는 생각한다 ” (래리)
  • 47 재능이 넘치는 인재가 구글로 모여듭니다. 우리가 이들에게 세상을 바꿀 힘을 주기 때문입니다. 구글이 직원 한 사람 한 사람이 모두 뚜렷한 성과를 낼 수 있도록 뒷받침하는 컴퓨터 자원 및 배급망을 갖고 있기 때문입니다.
  • 우리가 갖고 있는 기본적인 강점은 바로 업무 현장입니다. 직원이 기여를. 하고 이 과정에서 성장할 수 있는 현장, 중요한 프로젝트들이 진행되는 현장입니다. (기업공개시 세르게이가 투자안내서에 동봉한 편지)
  • 52 래리와 세르게이는 의도적으로 다른 사람들이 창업자처럼 행동할 수 있는 공간을 만들었다. 미래에 대한 어떤 전망을 갖고 있는 사람들에게는 자기만의 구글을 창조할 기회를 제공했다.
  • 54 이 책을 쓰면서 내가 기대하는 여러 가지 것들 가운데 하나는, 이 책을 읽는 모든 사람이 스스로를 창업자라고 생각하면 좋겠다는 점이다. 회사 전체의 창업자가 아니더라도 팀, 가정, 문화의 창업자는 될 수 있지. 않겠는가. 구글의 경험에서 얻을 수 있는 가장 중요한 교훈은, 가장 먼저 할 일은 자기가 창업자가 되기를 원하는지 아니면 누군가의 직원이 되기를 원하는지 선택하는 일이라는 것이다.
  • 55 “… 리더로서 내가 할 일은 우리 회사의 모든 직원이 커다란 기회를 갖도록 하는 것 그리고 직원이 각자 가치 있는 옇양을 미치고 있으며 사회를 좀 더 낫게 만드는 데 기여하고 있다고 느끼도록 하는 것이다 …” (래리)
2장. 문화는 아침으로 전략을 먹는다
  • 61 “사람들은 강력한 문화를 해석할 때 보통 인공물을 바탕으로 접근합니다. 이런 것들이 가장 시각적이기 때문이죠. 그러나 그런 것들 바탕에 내재되어 있는 여러 가지 가치관들과 가정들이 훨씬 더 중요합니다” (애덤 그랜트, 와튼스쿨)
  • 64 구글의 기업문화를 규정하는 세 가지 측면을 알아야 한다. 그것은 사명(mission), 투명성(transparency) 그리고 목소리(voice) 다.
  • 구글의 사명은 구글 문화의 시금석이 되는 것이다. 우리의 사명은 ‘전 세계의 정보를 조직해 누구나 쉽게 접근하고 사용할 수 있도록 하는 것”이다.
  • 65 왜 이것이 우리의 사명인지 혹은 이런 목표를 추구하는 우리의 궁극적인 목적이 무엇인지도 언급하지 않는다. 그러나 정보를 조직해 누구나 쉽게 접근하고 사용할 수 있도록 하는 것이 좋은 일이라는 사실은 저절로 분명히 알 수 있도록 되어 있다. 이런 사명은 직원 개개인이 수행하는 일에 의미를 부여한다.
  •  70 우리가 정한 광범위한 사명은 구글 직원들과 그 밖의 다른 사람들이 정말 멋진 것들을 창조할 수 있는 공간을 제공했다. 이런 창조와 성취가 봇물 터지듯이 나타나는 것은, 구글이 사상할 수 있는 어떤 경계선 너머를 향해 계속 나아가도록 하는 것을 사명으로 설정함으로써 나온 직접적인 결과물이다. 세상에서 가장 재능이 넘치는 사람들은 야망을 자극하는 어떤 영감을 원한다. 관리자 혹은 리더가 해야 하는 일은 조직에 이런 목표를 만드는 것이다.
  • 71 애덤 그랜트 <<기브앤테이크>>
  • 73 직원들로 하여금 자기가  돕는 사람을 직접 만나게 하는 것이야말로 가장 큰 동기부여 요소라는 사실이다.
  • 75 (중략) 구글 직원들은 이 회사의 이야기를 담은 영상을 처음 접했을 떄 전율을 느끼며 고무됐다.  (중략) 이런 순간들을 경험하게 하고 공유하게 하는 것이야말로 구글 직원이 구글이라는 회사의 사명에 보다 단단하게 연결되도록 만드는 과정이다. 이런 연관성을 만드는 데서 비롯되는 편익이 설령 애덤이 발견했던 효과의 절반밖에 되지 않는다 해도 이런 노력은 매우 훌륭한 투자다.
정보 공유를 두려워하지 말라
  • 78 덩치가 큰 조직에서는 흔히 여러 하부 죅들이 쓸데없는 일을 하면서 자원을 낭비한다. 그러나 정보가 공유될 때 전 직원은 다른 부서나 팀의 목표가 제각기 다르다는 사실을 충분히 이해하고 내부의 소모적인 경쟁을 피한다.
  • 81 투명성이 가져다주는 뜻하지 않은 이득 가운데 하나는 단지 자료를 공유하는 것만으로도 생산성이 향상된다는 점이다.
  • 83 만일 당신이 어떤 사람을 험담하는 이메일을 누군가에게 보낸다면 이 이메일을 받은 사람은 곧바로 그 내용을 당사자에게 전달한다.
누구나 스스로 운명을 결정하려 한다
  • 84 목소리는 구글 문화의 세 번째 시금석이다. 목소리는 직원에게 회사 운영 방식을 실제로 얘기해주는 것을 뜻한다.
문화는 검증받을 때 가장 중요하다
직원에게 부여한 자유가  가져오는 결과
  • 93 우리는 문화를 잃어버리는 것에 대한 편집증을 갖고 있으며 또한 이 편집증을 즐긴다.  현재의 문화에 만족하지 않는다는 오싹한 느낌까지도 함께 즐긴다. 이것은 좋은 징조다! 우리가 자랑스럽게 여기는 문화를 잃어버릴지도 모른다는 위태로움이 직원들로 하여금 문화에 대해 긴장의 끈을 놓지 않도록 만든다.
3장. 신입 직원은 모두 평균 이상이다
어떤 조직에서든 인재 채용이 가장 중요한 까닭
교육, 훈련보다 채용에 투자하라
  • 107 평균적인 능력을 가진 사람을 교육을 통해 슈퍼스타로 키워내는 일은 불가능에 가까울 정도로 어렵다.
  • 107 평범한 직원이 위대한 인재로 탈바꿈한 사례가 적지 않지만 이런 성공은 대부분 교육의 결과라기 보다는 업무의 유형이나 맥락을 바꾼 결과다.
  • 108 결론적으로 말해 기존 직원을 대상으로 한 교육, 훈련 예산이 높게 잡혀 있다는 사실 자체는 그 회사가 사람에 많은 투자를 하고 있다는 증거가 될 수 없다. 회사가 필요로 하는 인재를 제대로 채용하지 못했다는 증거일 뿐이다.
채용에 오랜 시간을 들여라
  • 111 인재 채용에 있어 두 가지 큰 변화를 반드시 감행해야 한다.
  • 첫째는 채용을 천천히 해야 한다. 지원자들 가운데 오로지 10퍼센트만이 장차 최고의 성과를 낼 것이므로, 보다 많은 지원자들이 찾아오도록 유인해야 하고 또 보다 많은 사람을 면접장으로 불러들여야 한다.
자기보다 더 나은 사람을 채용하라
  • 115 인재 채용. 과정에서 우리가 시도한 두 번째 커다란 변화이기도 한데, 바로 ‘자기보다 더 나은 사람을 채용하라’이다.
  • 116 해당 팀의 관리자에게 채용에 관한 모든 권한을 넘겨줄 경우 이 관리자는 팀원에게 지나치게 많은 권한을 휘두르게 된다 (구글에서 우리가 관리자의 권한을 최소화하려는 이유는 뒤에 이어지는 여러 장에 걸쳐 자세하게 설명하겠다).
  • 117 구글에서도 초창기에는 엘리트주의적인 접근법을 채택했다. 객관적인 자료를 갖고 보완하는 과정을 거치지 않고 본능이 이끄는 대로 인사 문제를 판단하고 처리했다. 하지만 인간의 본능이라는 게 얼마나 오류투성이인가.
  • 이런 오류를 극복하기 위해 우리는 고난을 극복할 능력과 끈기를 이미 보여준 후보자들을 물색하기 시작했다.
  • 119 누구나 최고의 인재를 채용하고 싶어 한다. 그러나 최고의 인재는 지능이나 전문성과 같은 단 하나의 소양만으로는 결코 파악할 수 없음을 알아야 한다.
  • 어떤. 사람이 어떤 환경에서 스타라는 사실이 또 다른 환경에서도 이 사람이 스타가 될 것임을 보장하지 않는다. 그러므로 자기 회사에서 어떤 사람이 성공을 거둘 수 있도록 하는 것이 채용과 관련한 가장 중요한 문제다.
  • 119 “재능에 대한 오해”의 교훈은 ‘똑똑한 사람은 채용하지 말라’가 아니라 ”똑똑하기만 한 사람을 채용하지 말라’다.
  • 어떤 회사의 구체적인 맥락 속에서 성공을 거둘 사람, 주변의 모든 사람들까지 성공하도록 만들어줄 사람을 채용하라는 말이다.
4장. 최상의 결과를 찾기 위한 검색
구글 ‘자기복제 재능 머신’의 진화
두 창업자와 함꼐 시작한  회사
  • 125 중요한 사실은, 그들 역시 채용 과정은 객관적이고 통상적인 기준을 따라야 함을 본능으로 알고 있었으며, 그 기준을 철저하게 지킬 최종 단일 검토자 한 명을 설정했다는 점이다.
달팽이처럼 느리게
  • 127 우리는 한. 분야의 전문가보다는 ‘여러 분야에 걸쳐 많은 걸 아는 똑똑한 사람’을 채용하고 싶었기 때문이다. 그 업체들은 우리가 자기가 하는 일을 정확하게 아는 사람보다 똑똑하고 호기시 ㅏㄴㅎ은 사람을 선호한다는 사실을 의아하게 여겼다.
  • 130 지금 당장 닥친 문제를 풀 수 있을 뿐 아니라 미래에 닥칠 미지의 문제들까지도 풀 수 있는 인재를 어디에서 찾을 것인가 하는 과제는 지금도 중요한 숙제로 남아 있다.

내 꿈.

꿈속에서 몸무게도 재 주고, 손 맛사지도 해주고, 따듯한 물에 담가 기분도 좋게 해주고, 잠깐 하늘도 날개 해 주는 이상한 기구를 이용하느라 만원이 들었는데,
그때 내가 빈손으로 나간바람에 외상으로 사용했다
주인 아저씨한테 내 핸드폰을 맡기고 가겠다고 했더니,
아저씨는 핸드폰은 됐고 전화번호랑 주민번호를 꼬치꼬치 캐물었다.
부모님성함까지 물어봤다.
나를 완전 꼬맹이로 생각하셨다.
하긴 핸드폰을 맡겨버리면 아예 연락이 안되니까 그러셨나보다.
알았다. 금방갔다오겠다고. 요 앞에 부모님 계시니까 좀만 기다리라고 하고 터벅 터벅 걸어오는데. 왜인지 신발이 너무 무거워서 발을 떼기가 힘들었다. 걷는거 자체가 너무 힘들었다.
밖엔 눈이왔다.
초딩들이 눈싸움을 하고 있다.
‘신난다 ~ 재미난다 ~ 더 게임오브 데쓰 !’ 눈싸움을 하면서 데쓰게임을 한다.
뭘 어떻게 한다는 건지 . 눈이라도 잔뜩 먹이는 건지 궁금했다.
어두침침한 골목길이 무서웠다.
밖은 눈이 왔고 왠 남자들이 삼삼오오 모여 있었다.
가는길에 정신을 차려보니 앞이 잘 보이지 않았다.
내 안경. 어디갔지.
가던길을 다시 되 돌아가 벗어져 있는 내 안경을 발견했다.
그리고 어떤 실내로 들어갔다.
엄마 아빠는 계시지 않았다.
어떤 언니가 한분 계셨다. 지금은 기억이 안나지만 언니는 어떠한 이유로 인간에 관한 탐색을 하고 있는 중이었다. 컴퓨터를 어떻게 조작하시더니 어떤 프로그램을 불러냈다. 걔는 입력하는 거에 대해 연관되는 키워드를 다 뽑아 준다. 개미부터 시작하면 인간까지 갈 수 있다고 했다. 개미. 하고 딱 엔터를 누르면 많은 것들이 쏟아져 나온다. 그중에서 하나를 손으로 꾹 누르면 또다시 새로운 세상이 펼쳐진다.
난 옆에서 신기해하며 잠자코있었는데 아까 아저씨한테 금방 온다고 했던 것이 생각났다. 난 그자리에서 언니한테 만원만 빌려달라그랬다. 이미 시간이 너무 많이 흘렀다. 아까 그 무거운 신발이 아닌 다른 신발을 신고 그 곳을 나섰다. 벌써 밤 11시가 넘었다. 가기전에 영업을 아직도  하는지 알아봐야 했다.
젠장. 열시까지 하잖아. 그래도 혹시 주인아저씨는 있을지도 모른다는 생각에, 전화를 걸었다…