소시오톡
[수리사회학] Persistence of social signatures in human communication
 
1
1
  71
2017-06-08 19:40:05

본 게시글은 2017년 5 11 [수리사회학] 강의에서 발제되었던 연구논문
Saramäkia et al. 2014. "Persistence of social signatures in human communication." PNAS.
에 대한 내용 및 교수님과 수강생 분들의 질문 및 말씀을 정리한 것입니다.


많은 말씀 주셨지만 발제자의 역량이 부족해 모든 내용을 조리있게 담는 것이 쉽지 않았습니다.

부족한 글인데도 불구하고, 읽어주시게 된 점에 대해 글을 읽기 전에 먼저 감사하다는 말씀 드립니다.

----------------------------------------------------------

  1. Intro


1> 개인 환경에 변화에 따른 네트워크 구성원의 변화를 관찰할 수 있으나, 변화에 따른 네트워크의 분포 등에 대한 연구를 진행하려 했다.
2> 개인의 네트워크에 대한 분석을 위해, 특정 Ego들의 통화 데이터, ego와 연결된 구성원(alter)들에 대한 설문 데이터를 분석하여, 시간이 지남에 따라 변화하는 환경에 대해 통화 네트워크의 분포 및 패턴의 변화로부터 관찰할 수 있는 결과를 확인하였다.

3> 이 실험에서 통화 데이터가 ego의 social signature가 될 수 있음을 보여주고 있다.


2. Dataset and methodology


1> 실험 대상

본 연구에서는 시간이 지남에 따라 현재 고등학교에서 이후에 대학교 혹은 직장 등으로 환경의 변화를 겪게 되는 학생들 24명에 대하여, 18개월 동안의 통화 데이터 및 설문 데이터를 수집하였다.
이 때, 고려된 제어인자는 성별로 24명에 대해 male과 female수를 12명으로 동일하게 구성하였다.


*Q1) 본 연구의 실험 대상 선정

연구에서 위와 같이 특정 환경에 처한 인물들을 가정하여 진행한 실험의 결과를 토대로 연구의 결론을 도출했기 때문에 이에 대해 질문이 있었습니다.

이는 학생을 대상으로 한 것이기 때문에, 다른 성격을 띠는 집단에 대해 실험을 진행한 결과와는 차이가 있지 않을까 하는 것이며 따라서 다양한 성격의 잡단의 실험군을 구성하는 것이 연구 결론이 타당하게 설명될 수 있을 것이라는 말씀이었습니다. 

본 연구에서, 보여주려고 했던 것은 환경이 변화함에 따른 개인의 distribution of calls의 변화가 어떠하며 이것으로 social signature의 성격이 나타나는지를 보여주었기 때문에, 특정 집단에 대한 의미 보다는 환경에 변화를 설명하는 것이라고 봤으며 오히려 특정 집단에서 이런 결과를 얻을 수 있었으니 확장될 수 있을 것이다라는 말을 하려고 했던 것 같습니다.

연구에서 진행한 실험에서는, 실험 대상에 대해서 제어인자에 대한 고려는 잘 되어있지 않은 것으로 보입니다. 만약 다양한 성격을 띠는 실험군을 구성하여, 각각의 성격을 가진 실험 대상에 대해 나타나는 차이를 구체적으로 밝히고자 한다면, 아래와 같이 실험 대상의 성격 및 수준을 설정하여, 실험계획법을 통해 적정 수의 표본을 설정하여 실험을 진행해볼 수 있을 것이라고 생각합니다.


Table. 실험대상이 되는 ego에 대해 고려할 수 있는 성격의 예시

Level 1

Level 2

Level 3

Age

10~20

20~30

40대 이상

Sex

Female

Male

Personality

외향성

내향성

이도 저도 아님

요금제(?)

~5만원

~10만원

10만원 이상


이에 추가적으로, 실험기간이 18개월인 것에 대해 비효율적이 아닌가에 대한 의견을 주셨습니다. 이를 해결할 수 있는 방안에 대해서는 실험으로 얻고자 하는 정보에 성격에 따라 대안을 고려해볼 수 있을 것 같습니다.


2> Datasets

본 연구에서는 실험 대상 24 egos의
Mobile phone call data & Survey data of emotional closness about alters

에 대한 정보를 토대로 분석을 진행하였습니다.


Phone call data의 경우, ego가 네트워크를 이루는 각 alters와의 통화 횟수 그리고 통화 시간을 수집하였습니다. 이는 log 값과 Rank값으로 변환하여 이후 regression 및 JSD를 구하는데 적용됩니다.

Survey data의 경우, 실험을 진행하는 18개월 중 6개월 간격으로 실험 대상들에게 설문을 진행하여, 통화가 발생했던 alters에 대한 emotional closeness와 time between face-to-face contact 정보를 수집합니다. 이 때 emotional closeness의 경우 1부터 10사이의 척도로 감정적으로 가까울 수록 큰 값으로 수집하였습니다.


Table. 연구에서 수집한 phone call data

Log 변환

Rank

Number of calls

Log(Number of calls)

값이 높은 것부터 오름차순

Duration of calls

Log(Duration of calls)

``


Table. 연구에서 수집한 survey data

Description

emotional closeness

scale of 1–10, with 1 the least and 10 the most emotionally intense relationship

time between face-to-face contact

마지막으로 대면한 후로부터의 시간 간격

the phone numbers of alters

alters 정보


*Q2) Phone call data를 사용?

본 연구에서 개인의 네트워크와 social signature를 알아보는데 있어서, 왜 phone call data만이 이용되었는가? 많은 분들이 전화 뿐만 아니라 text message 역시 개인을 연결하는 의미있는 매개이며, SNS network 역시 통화 데이터와 다른 의미를 가진 네트워크 분석이 가능할 터인데 이들은 왜 함께 분석되지 않은 것인지에 대해서 의문이 있었습니다.


3> Methodology and framework

- 먼저 egos의 통화 데이터가, emotional closeness와 어떤 관계를 가지는지 관찰하고 따라서 어떤 의미를 가지는 정보인지를 설명하기 위한 분석으로 regression을 실행하였습니다.
단, 회귀모형에서 변수가 ego와 alters에 대한 것이며, 이는 ego에 대해 각각 다른 alters의 구성으로 이루어져 있는 구조를 이루고 있으므로, 변수간의 계층을 고려한 multilevel regression을 적용하였다.


paper에서 회귀식을 나타내고 있지 않으나, 실험에 적용된 식을 다음과 같이 추측하면 


i alter, jego일 때



y_ij: 반응변수  x_ij: 설명변수  β_0j, β_1j: 추정된 계수  ε_ij: residual

이 때 반응변수는 emotional closeness이며, 설명변수는 no. calls가 되어

통화량에 따른 emotional closeness와의 관계를 설명합니다.

다수준 모형을 사용함으로써, ego와 alter사이에서 변수간에 관계를 설명하는 정도가 어떠한지도 확인할 수 있습니다. %uB

Multilevel regression의 결과 table에서 fixed effect의 No. calls 변수의 계수 추정값을 확인하면 이 값이 양의 값으로 추정되었으며 emotional closeness와 no. calls가 양의 상관관계가 있음을 알 수 있다. 즉, 통화 횟수가 많은 alter일수록 emotional closeness가 높은 사람은 것을 설명하게 되며, 이후의 분석에서 통화량이 많은 alter에 대해서는 자연스럽게 emotional closeness를 해석할 수 있게 됩니다.


*Q3) emotional closeness

emotional closeness를 단순히 no. calls 만으로 설명하는 것이 적합하지 않다는 말씀을 주셨습니다.

다만 본 연구에서는 emotional closeness와 no. calls의 상관성의 유의함을 통계적으로 보였기 때문에 이후에 no. calls의 분석 결과의 해석을 emotional closeness와 연결지어도 무리가 없다고 생각합니다. 연구 의도가 emotional closeness를 predict하기 위한 예측 모형을 고안하는 것이라면, 이를 위한 여러가지 covariate를 고려하여야 하겠지만, 꼭 이 연구에서는 그럴 필요는 없다고 보았습니다.



- no. calls 데이터가 가지는 의미를 확인했고, 이후에는 이 정보에 대해 ego와 alter의 network를 표현하며 다음과 같은 figure 들을 얻을 수 있습니다.


ego로 부터 alters에게 발생하는 calls의 정보(A)를 전체에 대한 alter별 비율로 계산하여 그에 대한 rank를 매김 (B)

(B)같은 방법으로 다른 ego대해서, 혹은 interval 별로 분포를 나타낼 수 있다.
(C)
에서 한 ego의 분포 예시를 보여주며, box & whisker plot 으로 jaccard index를 확인한다.

(D)는 통화량의 분포를 보여주고 있으며, 여기서는 기간별 새로 발생한 alters의 통화량 분포 모양의 유사함을 보여주고 있다.


특히 (C)에서는 18개월의 시간을 6개월 단위로 나눈 interval I1, I2, I3에 대해서 임의의 ego에 대해 가장 많은 통화량이 발생한 Top 20의 변화가 interval마다 얼마나 차이가 발생하는지 알아보기 위해 Jaccard index를 사용하여 그 유사도를 관찰, social signature로써의 의미가 있는지를 확인할 수 있습니다.

Jaccard index는 아래와 같이 나타냅니다.



사건의 두 집합에 대한 합집합의 경우에 대한 교집합의 경우의 수를 의미

본 연구에서 각 ego에 대해서, interval에 따른 alters에 대한 calls의 분포가 유사한지를 확인하기 위해 사용한 것이며, rank에서 fraction이 겹치는 부분이 발생하는 경우가 얼마나 발생하는 지를 탐지하여 분포가 유사한지를 확인합니다.

J(I_i,I_j )01사이의 값이며, 1에 가까울 수록 I_i,I_j 간의 유사도가 큰 것으로 볼 수 있음


(C)의 그림에서 확인한 것과 같은 내용을 아래 그림에서는, 서로 다른 ego에 대해 interval별로 network의 구성원의 변화가 어떠한지 살펴보고 있습니다.


(A,B,C) (D,E,F)는 두 명의 ego에 대해 interval I1, I2, I3에 대한 no. call의 rank 분포를 보여주고 있습니다. 이 그림에서는 환경이 변함에 따라 통화를 많이 하게 되는 network의 구성원은 변화하지만, 그 분포는 각 ego가 크게 변하지 않으며, 그 robustness가 ego의 social signature가 될 수 있음을 설명하고 있습니다.


Ego간의 유사도와 ego의 interval간 유사도를 구체적으로 설명하기 위해 본 연구에서는 Jensen-Shannon Divergence(JSD) 개념을 적용하였습니다. Shannon entropy의 개념과 연결되는 것이며, 앞의 figure에서 나타나는 그래프 간의 유사도를 계산함으로써, social signature로써의 설명력을 support하고 있습니다.

 



(B)는 ego별로 ego의 interval 간의 유사도인 dself와 ego간의 유사도 dref를 계산한 분포도를 나타내었으며, (C)는 전체 ego에 대한 dself와 dref를 보여주고 있습니다. 두 그림은 결과적으로 dref > dself의 값이 큰 분포가 많이 나타나며 이는 interval간의 유사도가 ego간의 유사도 보다 큰 값임을 의미하면서 동시에 social signature로써의 의미를 support하고 있음을 알 수 있습니다.

(D)는 JSD와 Jaccard index를 축으로 하는 dref와 dself의 scatter plot을 나타냈으며, 여기서는 dself는 두 유사도가 적절한 음의 상관관계가 나타나고 있음을 확인할 수 있다.


4. conclusion

본 연구의 결과로써 말하고자 했던 three unique findings를 다음과 같이 정리하였습니다.


(i)  사람들이 자신의 alters에게 자신의 의사 소통을 할당하는 방식에 있어 일관성, 광범위함 그리고 robust pattern이 있으며 소수의 top-ranked는 감정적으로 가까운 사람들이 많은 전화를 받는다.



(ii)
일반적 패턴에서, 각 개인이 의사 소통 할당의 특정 방법을 묘사하는 특징적인 social signature을 갖도록 하는 명확한 개인 수준의 variation있다.



(iii)
individual social signature시간이 지남에 따라 특징적인 모양을 유지하며 네트워크 전환에 의해 약한 영향을 받는다. 따라서 개개인이 누구인지에 관계없이 시간을 할당하는 방식이 각자 다르다.



5. 그 외 해주신 말씀들


//

첫 번째, 연구에서 확인된 ego networks hierarchical layer social role로 생각해 볼 수 있을까요?

두 번째, 연구의 결과를 Out of sight, out of mind를 보여주었다고 해석해도 괜찮을까요?

번째, 만약 ego network의 상태를 세 시점에서(초기 시점인 t1, 6개월 후인 t2, 1년 후인 t3)가 아니라 매일 확인해서 보여줄 수 있다면 어떻게 바뀌었을지도 궁금하네요.

//

- 전반적인 결론은 Ronald S. Burt, "Network-Related Personality and the Agency Question: Multirole Evidence from a Virtual World," American Journal of Sociology 118, no. 3 (November 2012): 543-591. 와 유사한 것으로 보임. Burt AJS 페이퍼에서 한 사람이 온라인 게임내 한 계정에서 여러 캐릭터를 만들 때 자신의 네트워크를 구축하는 방식이 role이 다름에도 불구하고 유사했다라는 주장. Saramiki는 시간이 지나도 유지되는 network structure 'social signature'라고 Burt 'Network Consistency'라고 명명.

- 시차가 크게 존재하지 않는 두 연구이지만 Saramiki Burt문헌을 인용하지 않은 것도 하나의 재미있는 현상인듯. (동시발견이라고까지 하기에는 좀 민망하지만...)

- 주장 및 결과 자체는 상당히 설득력이 있다고 생각이 됨. 그런데, 그런데 그렇다면, 결국 사회연결망 연구 전통에서 '구조적인 효과'라고 믿어지는 네트워크 위치에 따른 이득과 불이익 또한 결국 다시 특정 성격변수로 환원될수도 있는 것일까? 라는 의문이 들었음. 가령 최근 경영학 문헌 쪽에서 사회연결망을 다시 Big 5 personality traits로 환원시키는 시도가 있었고, structural hole을 나타내는 network-constraint 변수도 self-monitoring과 같은 성격변수와 인과성을 지닐 가능성을 제시하는데, 구조적 영향력은 어떻게 포착될 수 있는 것인가? 하는 의문.

//

이번 주 Saramäki et al. 2014 리딩은 연구 참여자들이 주고받은 전화를 egocentric network 데이터 형태로 만들어서 사람들 사이에서, 그리고 한 사람 내부에서 나타날 수 있는 친밀성 네트워크의 독특성을 잘 보여준 것 같습니다. 특히 시간에 따라 연구 참여자들의 상황이 변화함에도 불구하고 egocentric network '구조'(혹은 엄밀한 표현이 아니라면 논문에서 언급한 'social signature')가 지속적으로 비슷한 모습을 보여주는 것은 정말 흥미로운 현상인 것 같습니다.

다만 이러한 social signature의 변화를 온전히 이 연구가 포착하지 못했을 가능성도 생각해 볼 필요가 있을 것 같습니다. 이는 마지막 문단에 저자들이 언급한 SNS와 같은 대안적 커뮤니케이션 방식과도 연관된 문제인데요, fraction에 기반한 social signature는 빈도의 변화까지 온전히 담아낸다고 보기는 어렵기 때문입니다. 생활 방식의 변화나 SNS와 같은 새로운 커뮤니케이션 매체의 등장이 social signature가 아니라 '전화'라는 커뮤니케이션 매체의 사용 빈도 자체를 바꾸게 만들 가능성은 여전히 남아있는 것 아닐까 싶었습니다.

//

- 이 연구의 주요한 발견 중 하나는 ‘ego’ ‘alter’에게 관심을 분배하는 관계 및 그 구조에 있어구체적인 대상은 바뀌더라도 전체적인 구조는 남아있다는 것이라 생각합니다. 그러나 이러한 발견은 저자 중 하나인 Dunbar의 기존 연구 등과 그리 큰 차별점이 없는 듯 합니다. 저는 이것이 ‘ego’의 통화 기록에 기반한 자료이기 때문에 발생하는 것이라 생각합니다. 자료의 특성 상 전체 네트워크(global network)를 구성할 수 없어 (1) 타인들(alter alter)끼리의 관계를 알 수 없고, (2) 관계의 방향성(i.e., ego → alter; alter → ego)을 알 수 없으며, (3) 결과적으로 ‘ego’의 구조적 위치를 알 수 없습니다. 이러한 한계는 어떤 관계가 계속 유지되는지 혹은 쉽게 끊어지는지에 미치는 사회적 배태성(social embeddedness)의 영향, 지위 및 중심성에 따른 갖가지 영향, 정보의 흐름과 관련된 영향 등을 볼 수 없게 만듭니다.

이 한계는 의도치 않게 뇌와 관련된생물학적 설명이나 개인 수준의 차이에 관한심리학적 설명을 관찰된 현상에 적용하려는 946쪽의 논의와 관련된 것으로 보입니다. 따라서 이 자료의 특성에 따른 한계를 명확히 할 필요가 있다고 생각합니다.

//

본 연구는 연구 결과를 설명하는 메커니즘들을 소개하고 있다(943). 그 중에서 주목해 볼 만한 설명은 persistence가 개인의 인지 능력 내지 core brain region, 나아가 mentalizing에 기인한다는 것이다. 하지만 이러한 개인들이 능력들이 항상적인지(constant) 아니면 변이를 갖는지(time-variant)에 관한 설명이 본문에는 부족하다. 매우 장기적인 관점에서 보면, 개인이 사용하는 communication의 수단이 개인의 이러한 인지 능력에 변화를 줄 수도 있을 것이다.

마지막으로 본 연구의 말미에 age, sex, personality와 같은 변수가 제시되고 있는데, 여전히 이러한 인구-사회경제적 변수들이 본 연구 결과에 confound 되어있을 가능성도 고려해야 한다. 여전히 메커니즘에 관한 설명은 사회학에서 중요해보인다.

//

- Social Signature Ego를 둘러싼 환경이 아니라 Ego 의 사회경제적 속성에 강한 변화가 생겼을 때 변할 가능성도 배제할 수 없다. 연구대상의 수 자체가 적기는 하지만, 무작위성을 보증하기 위한 변수로 제시된게 성별 외에는 명시적으로 찾기 어렵다. 그렇다면 다양한 대안적 인과를 배제하기 위하여 무엇을 모델에 추가해야 할까?

- 논문에서 확인할 수 있는건 어디까지나 네트워크의 ''이며, 네트워크의 형태는 확인할 수 없다. 5명의 사람에게 분배된 연락 비율의 배열이 동일하다 하더라도, 5명 사이의 관계는 전혀 다를 수 있다. 네트워크의 형태까지 반영하여 연구를 한다면 어떤 방식으로 할 수 있을까?

//

사람은 주위의 환경이 새롭게 변화하면 그 환경에 적응하기 위해 새로운 친구들과의 네트워크를 형성하기 위한 노력을 한다고 생각한다. 그러나 이러한 비용을 투자함에도 과거에 투입한 자원으로 형성된 인적 네트워크는 쉽게 사라지지 않는다고 생각된다. 따라서 현재 자신이 비용을 투자함으로써 형성하고 있는 관계에 집중함에 따라 지금 자신 주위의 있는 사람들과 자주 연락한다고 볼 수 있지만 이미 형성된 인간관계가 사라지거나 변화하지 않을 것 같다. 본 논문에서도 지적하고 있지만 더욱 장기적으로 봤을 때, 일반적으로 새로운 인맥을 형성하지 않을 때의 양상은 달라질 수 있지 않을까라는 의문이 들었다.

//

기본적으로 모델과 결과에 별다른 질문이 생기지 않을 정도로 잘된 연구라고 생각합니다. 개인적으로도 pairing behavior를 뒷받침해주는 결과에 동의하구요. "Reference group" 논의도 뒷받침되는 것 같습니다.

, 전화 행위 자체가 특정한 형태의 소통을 위한 것인만큼, 사례로 선택한 telephone call 에 대해 근본적인 질문이 생기는데요.

SNS 상의 행동 등과 같은 다른 online behavior 에서도 같은 결과가 나올까요?

-----------------------------------------------------------------------------------------

은 의견을 주시고 이에 대해 말씀 나누어 주셨는데 모든 내용에 답을 드릴 수 없었던 점 양해 부탁드립니다.


사합니다.


 



   
NO
Comments
아직까지 남겨진 코멘트가 없습니다. 1 님의 글에 코멘트를 남겨주세요!